O que é o Azure AI Document Intelligence?
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (GA)
O Azure AI Document Intelligence é um serviço de IA do Azure baseado na nuvem que lhe permite criar soluções inteligentes de processamento de documentos. Grandes quantidades de dados, abrangendo uma grande variedade de tipos de dados, são armazenadas em formulários e documentos. A Inteligência Documental permite-lhe gerir eficazmente a velocidade a que os dados são recolhidos e processados e é fundamental para melhorar as operações, tomar decisões informadas baseadas em dados e inovar de forma esclarecida.
| ✔️ Modelos de análise de documentos | ✔️ Modelos pré-construídos | ✔️ Modelos personalizados |
Modelos gerais de extração
Os modelos gerais de extração permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para os negócios pronto para a ação, uso ou desenvolvimento da sua organização.
Ler | Extraia texto impresso e manuscrito.
Layout | Extraia texto, tabelas e estrutura do documento.
Ler | Extraia texto impresso
e manuscrito.
Layout | Extraia texto,
tabelas e estrutura do documento.
Documento geral | Extraia texto,
estrutura e pares chave-valor.
Modelos pré-criados
Os modelos pré-construídos permitem-lhe adicionar processamento inteligente de documentos às suas aplicações e fluxos sem ter de treinar e construir os seus próprios modelos.
Serviços Financeiros e Jurídico
Extrato Bancário | Extraia informações da conta e detalhes de extratos bancários.
Verificar | Extrair informações relevantes dos controlos.
Contrato | Extraia os detalhes do contrato e da parte.
Cartão de crédito | Extraia as informações do cartão de pagamento.
Fatura | Extraia detalhes de clientes e fornecedores.
Pay Stub | Extraia detalhes do esboço de pagamento.
Recibo | Extraia detalhes da transação de vendas.
Imposto dos EUA
Imposto unificado dos EUA | Extrato de qualquer formulário de imposto dos EUA suportado.
Imposto dos EUA W-2 | Extraia detalhes da compensação tributável.
Imposto dos EUA 1098 | Extraia 1098
detalhes da variação.
Imposto dos EUA 1099 | Extraia 1099
detalhes da variação.
Imposto dos EUA 1040 | Extraia 1040
detalhes da variação.
Hipoteca dos EUA
Hipoteca dos EUA 1003 | Extraia detalhes do pedido de empréstimo.
Hipoteca dos EUA 1004 | Extraia informações da avaliação.
Hipoteca dos EUA 1005 | Extrair informações da validação do emprego.
Hipoteca dos EUA 1008 | Extraia detalhes de transmissão de empréstimo.
Divulgação de hipotecas nos EUA | Extraia as condições finais de fechamento do empréstimo.
Identificação Pessoal
Cartão de seguro de saúde | Extraia detalhes da cobertura do seguro.
Identidade | Extraia os detalhes da verificação.
Certidão de casamento | Extraia informações de casamento certificadas.
Fatura | Extraia detalhes de clientes
e fornecedores.
Recibo | Extraia detalhes da transação de vendas
.
Identidade | Extraia detalhes de identificação
e verificação.
Cartão de seguro de saúde | Extraia detalhes do seguro de saúde.
Cartão de visita | Extraia detalhes de contato comercial.
Contrato | Extraia os detalhes do contrato
e da parte.
Imposto dos EUA W-2 | Extraia detalhes da compensação tributável
.
Imposto dos EUA 1098 | Extraia 1098
detalhes da variação.
Modelos personalizados
Os modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de formulários e documentos, específicos para seus casos de uso. Modelos personalizados independentes podem ser combinados para criar modelos compostos.
Modelos de extração de campo de documentos
✔️ Os modelos de extração de campo de documentos são treinados para extrair campos rotulados de documentos.
Neural personalizado | Extraia dados de documentos de tipo misto.
Modelo personalizado | Extraia dados de layouts estáticos.
Composto à medida | Extraia dados usando uma coleção de modelos.
Modelos de classificação personalizados
✔️ Os classificadores personalizados identificam os tipos de documentos antes de invocar um modelo de extração.
Classificador personalizado | Identifique os tipos de documentos designados (classes) antes de invocar um modelo de extração.
Capacidades adicionais
O Document Intelligence suporta recursos opcionais que podem ser habilitados e desabilitados dependendo do cenário de extração de documentos:
Recursos de análise
Model ID | Extração de conteúdo | Campos de consulta | Parágrafos | Funções de parágrafo | Marcas de seleção | Tabelas | Pares chave-valor | Idiomas | Códigos de barras | Análise Documental | Fórmulas* | Fonte de estilo* | Alta resolução* | PDF pesquisável |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
leitura pré-embutida | ✓ | ✓ | O | O | O | O | O | O | ||||||
layout pré-construído | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
contrato pré-construído | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
fatura pré-embutida | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
recibo pré-embutido | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
cartão de crédito pré-construído | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
extrato bancário pré-construído | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
pré-construído-hipoteca.us.1003 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-hipoteca.us.1004 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-hipoteca.us.1005 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-hipoteca.pt.1008 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDivulgação | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-tax.us.w4 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (vários) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-tax.us.1095A | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
pré-construído-tax.us.1095C | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
pré-construído-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
pré-construído-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (vários) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Ativado
O - Opcional
* - Os recursos Premium incorrem em custos extras
Modelos e opções de desenvolvimento
Nota
Os seguintes modelos de compreensão de documentos e opções de desenvolvimento são suportados pelo serviço de Inteligência de Documentos v3.0.
Você pode usar a Inteligência Documental para automatizar o processamento de documentos em aplicativos e fluxos de trabalho, aprimorar estratégias orientadas por dados e enriquecer os recursos de pesquisa de documentos. Use os links na tabela para saber mais sobre cada modelo e procurar opções de desenvolvimento.
Lida
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
leitura pré-embutida | ● Extraia texto de documentos. ● Extração de dados |
● Digitalização de qualquer documento. ● Compliance e auditoria. ● Processamento de notas manuscritas antes da tradução. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Esquema
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
layout pré-construído | ● Extraia texto e informações de layout de documentos. ● Extração de dados |
● Indexação e recuperação de documentos por estrutura. ● Análise de relatórios financeiros e médicos. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Documento geral (preterido em 2023-10-31-preview)
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
documento pré-construído | ● Extraia texto, layout e pares chave-valor de documentos. ● Extração de dados e campo |
● Extração de par chave-valor. ● Processamento de formulários. ● Recolha e análise de dados de inquéritos. |
● Estúdio de Inteligência Documental ● API REST |
Invoice
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
fatura pré-embutida | ● Extraia informações importantes de faturas. ● Extração de dados e campo |
● Processamento de contas a pagar. ● Registo e relatórios fiscais automatizados. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Recibo
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
recibo pré-embutido | ● Extraia informações importantes de recibos. ● Extração de dados e campo● O modelo de recibo v3.0 suporta o processamento de recibos de hotel de página única. |
● Gestão de despesas. ● Análise de dados de comportamento do consumidor. ● Programa de fidelização de clientes. ● Processamento de devolução de mercadorias. ● Registo e relatórios fiscais automatizados. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Identidade (ID)
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
prebuilt-idDocument | ● Extraia informações importantes de passaportes e bilhetes de identidade. ● Tipos de documentos● Extraia endossos, restrições e classificações de veículos das carteiras de motorista dos EUA. |
● Conheça a conformidade com as diretrizes de serviços financeiros do seu cliente (KYC).● Gestão de contas médicas. ● Pontos de verificação de identidade e gateways. ● Registo de hotel. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Marcar
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
verificação pré-embutida | ● Extraia informações importantes de cheques. ● Extração de dados e campo |
● Gestão de crédito. ● Gestão automatizada de credores. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Esboço de pagamento
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
pré-construído paystub | ● Extraia informações importantes de holerites. ● Extração de dados e campo |
● Verificação de detalhes da folha de pagamento dos funcionários. ● Deteção de fraudes para emprego. ● Processamento fiscal automatizado. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Extrato bancário
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
extrato bancário pré-construído | ● Extraia informações importantes de extratos bancários. ● Extração de dados e campo |
● Casos de uso de processamento de impostos. ● Gestão contabilística automatizada. ● Gestão de crédito-débito. ● Processamento de documentação de empréstimo. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Cartão de seguro de doença
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● Extraia informações importantes dos cartões de seguro de saúde dos EUA. ● Extração de dados e campo |
● Cobertura e verificação de elegibilidade. ● Modelagem preditiva. ● Análise baseada em valor. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Modelo de contrato
Model ID | Description | Opções de desenvolvimento |
---|---|---|
contrato pré-construído | Extraia o contrato e os detalhes da parte. ● Extração de dados e campo |
● Document Intelligence Studio ● API REST ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Modelo de cartão de crédito
Model ID | Description | Opções de desenvolvimento |
---|---|---|
cartão de crédito pré-construído | Extraia o contrato e os detalhes da parte. ● Extração de dados e campo |
● Document Intelligence Studio ● API REST ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Modelo de certidão de casamento
Model ID | Description | Opções de desenvolvimento |
---|---|---|
prebuilt-marriageCertificate.us | Extraia o contrato e os detalhes da parte. ● Extração de dados e campo |
● Document Intelligence Studio ● API REST ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulário de hipoteca dos EUA 1003
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
pré-construído-hipoteca.us.1003 | ● Extraia informações importantes de pedidos de 1003 empréstimo. ● Extração de dados e campo |
● Requisitos de documentação da Fannie Mae e Freddie Mac. | ● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulário de hipoteca dos EUA 1004
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
pré-construído-hipoteca.us.1004 | ● Extraia informações importantes das 1004 avaliações. ● Extração de dados e campo |
● Requisitos de documentação da Fannie Mae e Freddie Mac. ● Relatório uniforme de Avaliação Residencial para ajudar o credor/cliente com o valor de mercado do imóvel em questão. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulário de hipoteca dos EUA 1005
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
pré-construído-hipoteca.us.1005 | ● Extrair informações importantes da 1005 validação do emprego. ● Extração de dados e campo |
● Requisitos de documentação da Fannie Mae e Freddie Mac. ● Verificação do documento de trabalho para determinar a qualificação como potencial mortgagor. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulário de hipoteca dos EUA 1008
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
pré-construído-hipoteca.pt.1008 | ● Extraia as principais informações da Subscrição Uniforme e do Resumo de Transmissão. ● Extração de dados e campo |
● Processamento de subscrição de empréstimos usando dados resumidos. | ● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulário de divulgação de hipotecas nos EUA
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
prebuilt-mortgage.us.closingDivulgação | ● Extraia as principais informações da Subscrição Uniforme e do Resumo de Transmissão. ● Extração de dados e campo |
● Requisitos de detalhes finais do empréstimo hipotecário. | ● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Modelo W-2 Fiscal dos EUA
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
pré-construído-tax.us.W-2 | ● Extraia as principais informações dos formulários fiscais W2 do IRS US (ano 2018-2021). ● |
● Gestão automatizada de documentos fiscais. ● Processamento de pedidos de crédito hipotecário. |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
US tax 1098 (e variações) formulários
Model ID | Description | Opções de desenvolvimento |
---|---|---|
pré-construído-tax.us.1098{variation } |
● Extraia informações-chave de variações de 1098 formulários. ● |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
US tax 1099 (e variações) formulários
Model ID | Description | Opções de desenvolvimento |
---|---|---|
prebuilt-tax.us.1099{variation } |
● Extraia informações de variações de 1099 formulários. ● |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulários de imposto 1040 (e variações) dos EUA
Model ID | Description | Opções de desenvolvimento |
---|---|---|
pré-construído-tax.us.1040{variation } |
● Extraia informações de variações de 1040 formulários. ● |
● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Formulários de impostos unificados dos EUA
Model ID | Description | Opções de desenvolvimento |
---|---|---|
prebuilt-tax.us | ●Extraia informações de qualquer um dos formulários fiscais suportados nos EUA. | ● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Cartão de visita
Model ID | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
cartão de visita pré-construído | ● Extraia informações importantes de cartões de visita. ● Extração de dados e campo |
● Liderança de vendas e gestão de marketing. | ● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Visão geral do modelo personalizado
Sobre | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
Modelo personalizado | Extrai informações de formulários e documentos em dados estruturados com base em um modelo criado a partir de um conjunto de conjuntos de documentos de treinamento representativos. | Extraia dados distintos de formulários e documentos específicos para o seu negócio e casos de uso. | ● Document Intelligence Studio ● API REST ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
Neural personalizado
Nota
Para treinar um modelo neural personalizado, defina a buildMode
propriedade como neural
.
Para obter mais informações, consulte Treinando um modelo neural
Sobre | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
Modelo neural personalizado | O modelo neural personalizado é usado para extrair dados rotulados de documentos estruturados (pesquisas, questionários), semiestruturados (faturas, ordens de compra) e não estruturados (contratos, cartas). | Extraia dados de texto, caixas de seleção e campos tabulares de documentos estruturados e não estruturados. | Document Intelligence Studio ● API REST ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
Modelo personalizado
Nota
Para treinar um modelo de modelo personalizado, defina a buildMode
propriedade como template
.
Para obter mais informações, consulte Treinamento de um modelo de modelo
Sobre | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
Modelo de modelo personalizado | O modelo de modelo personalizado extrai valores e campos rotulados de documentos estruturados e semiestruturados. |
Extraia dados-chave de documentos altamente estruturados com modelos visuais definidos ou layouts visuais comuns, formulários. | ● Document Intelligence Studio ● API REST ● C# SDK ● Python SDK ● Java SDK ● JavaScript SDK |
Composição personalizada
Sobre | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
Modelos personalizados compostos | Um modelo composto é criado pegando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. | Útil quando você treina vários modelos e deseja agrupá-los para analisar tipos de formulário semelhantes, como ordens de compra. | ● Document Intelligence Studio ● API REST ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
Modelo de classificação personalizado
Sobre | Description | Casos de uso de automação | Opções de desenvolvimento |
---|---|---|---|
Modelo de classificação composto | Os modelos de classificação personalizados combinam recursos de layout e idioma para detetar, identificar e classificar documentos em um arquivo de entrada. | ● Um pacote de pedido de empréstimo contendo formulário de inscrição, holerite e extrato bancário. ● Uma coleção de faturas digitalizadas. |
● Estúdio de Inteligência Documental ● API REST |
O Azure AI Document Intelligence é um serviço de IA do Azure baseado na nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Document Intelligence aplica tecnologias de reconhecimento ótico de caracteres (OCR) e compreensão de documentos baseadas em aprendizado de máquina para extrair texto, tabelas, estrutura e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, consulte os artigos Conceitos:
Tipo de modelo | Nome do modelo |
---|---|
Modelo de análise documental | ● Modelo de análise de layout |
Modelos pré-construídos | ● Modelo de fatura● Modelo de recibo ● Modelo de documento de identidade (ID) ● Modelo de cartão de visita |
Modelos à medida | ● Modelo personalizado ● Modelo composto |
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (GA)
Modelos de inteligência documental e opções de desenvolvimento
Gorjeta
- Para uma experiência melhorada e uma qualidade de modelo avançada, experimente o Document Intelligence v3.0 Studio.
- O v3.0 Studio suporta qualquer modelo treinado com dados rotulados v2.1.
- Você pode consultar o guia de migração de API para obter informações detalhadas sobre a migração da v2.1 para a v3.0.
Nota
Os seguintes modelos e opções de desenvolvimento são suportados pelo serviço Document Intelligence v2.1.
Use os links na tabela para saber mais sobre cada modelo e navegue pelas referências da API:
Privacidade e segurança dos dados
Como acontece com todos os serviços de IA, os desenvolvedores que usam o serviço de Inteligência Documental devem estar cientes das políticas da Microsoft sobre dados de clientes. Consulte a nossa página Dados, privacidade e segurança para Inteligência Documental.
Próximos passos
Escolha um modelo de Document Intelligence.
Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.