Modelo de fatura de Document Intelligence
Este conteúdo aplica-se a: v4.0 (GA) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
::: Apelido-fim
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (GA)
O modelo de fatura do Document Intelligence usa poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) para analisar e extrair campos-chave e itens de linha de faturas de vendas, contas de serviços públicos e ordens de compra. As faturas podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto da fatura; extrai informações importantes, como nome do cliente, endereço de cobrança, data de vencimento e valor devido; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta faturas em 27 idiomas.
Tipos de documentos suportados:
- Faturas
- Contas de serviços públicos
- Ordens de venda
- Notas de encomenda
Processamento automatizado de faturas
O processamento automatizado de faturas é o processo de extração de campos-chave accounts payable
de documentos de conta de faturamento. Os dados extraídos incluem itens de linha de faturas integrados com seus fluxos de trabalho de contas a pagar (AP) para revisões e pagamentos. Historicamente, o processo de contas a pagar é realizado manualmente e, portanto, muito demorado. A extração precisa de dados-chave de faturas é normalmente a primeira e uma das etapas mais críticas no processo de automação de faturas.
Exemplo de fatura processada com o Document Intelligence Studio:
Exemplo de fatura processada com a ferramenta Document Intelligence Sample Labeling:
Opções de desenvolvimento
O Document Intelligence v4.0: 2024-11-30 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos | Model ID |
---|---|---|
Modelo de fatura | • Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fatura pré-embutida |
O Document Intelligence v3.1 suporta as seguintes ferramentas, aplicativos e bibliotecas:
Caraterística | Recursos | Model ID |
---|---|---|
Modelo de fatura | • Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fatura pré-embutida |
O Document Intelligence v3.0 suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos | Model ID |
---|---|---|
Modelo de fatura | • Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fatura pré-embutida |
O Document Intelligence v2.1 suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos |
---|---|
Modelo de fatura | • Ferramenta de etiquetagem de Inteligência Documental• API REST • SDK de biblioteca cliente• Contêiner Docker de Inteligência Documental |
Requisitos de entrada
Formatos de ficheiro suportados:
Modelo PDF Imagem: JPEG/JPG
,PNG
,BMP
,TIFF
, ,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLida ✔ ✔ ✔ Esquema ✔ ✔ ✔ Documento Geral ✔ ✔ Pré-criado ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e
4
MB para a camada gratuita (F0).As dimensões da imagem devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a cerca
8
de texto pontual a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e
1
GB para o modelo neural.Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é
1
GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é2
GB com um máximo de 10.000 páginas.
- Formatos de ficheiro suportados: JPEG, PNG, PDF e TIFF.
- PDF e TIFF suportados, até 2.000 páginas são processadas. Para assinantes de nível gratuito, apenas as duas primeiras páginas são processadas.
- O tamanho do arquivo suportado deve ser inferior a 50 MB e dimensões de pelo menos 50 x 50 pixels e no máximo 10.000 x 10.000 pixels.
Extração de dados do modelo de fatura
Veja como os dados, incluindo informações do cliente, detalhes do fornecedor e itens de linha, são extraídos das faturas. Você precisa dos seguintes recursos:
Uma assinatura do Azure — você pode criar uma gratuitamente.
Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.
Na home page do Document Intelligence Studio, selecione Faturas.
Você pode analisar a fatura de amostra ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :
Ferramenta de etiquetagem de exemplo de inteligência de documentos
Navegue até a Ferramenta de Exemplo de Inteligência de Documentos.
Na página inicial da ferramenta de exemplo, selecione o bloco Usar modelo pré-criado para obter dados .
Selecione o Tipo de formulário a ser analisado no menu suspenso.
Escolha um URL para o arquivo que você gostaria de analisar a partir das opções abaixo:
- Exemplo de documento de fatura.
- Exemplo de documento de identificação.
- Imagem de recibo de amostra.
- Exemplo de imagem de cartão de visita.
No campo Origem, selecione URL no menu suspenso, cole o URL selecionado e selecione o botão Buscar.
No campo Ponto de extremidade do serviço de Inteligência Documental, cole o ponto de extremidade obtido com sua assinatura do Document Intelligence.
No campo chave, cole a chave obtida do recurso Document Intelligence.
Selecione Executar análise. A ferramenta Document Intelligence Sample Labeling chama a API Analyze Prebuilt e analisa o documento.
Exibir os resultados - veja os pares chave-valor extraídos, itens de linha, texto realçado extraído e tabelas detetadas.
Nota
A ferramenta Exemplo de etiquetagem não suporta o formato de ficheiro BMP. Esta é uma limitação da ferramenta e não do Serviço de Inteligência Documental.
Idiomas e localidades suportados
Para obter uma lista completa dos idiomas suportados, consulte nossa página de suporte a idiomas de modelo pré-criados.
Extração de campo
Para campos de extração de documentos suportados, consulte a página de esquema do modelo de fatura em nosso repositório de exemplo do GitHub.
Os pares chave-valor da fatura e os itens de linha extraídos estão na
documentResults
seção da saída JSON.
Pares chave-valor
O modelo de fatura pré-construído suporta o retorno opcional de pares chave-valor. Por padrão, o retorno de pares chave-valor está desabilitado. Os pares chave-valor são extensões específicas dentro da fatura que identificam um rótulo ou chave e sua resposta ou valor associado. Numa fatura, estes pares podem ser a etiqueta e o valor que o utilizador introduziu para esse campo ou número de telefone. O modelo de IA é treinado para extrair chaves e valores identificáveis com base em uma ampla variedade de tipos de documentos, formatos e estruturas.
As chaves também podem existir isoladamente quando o modelo deteta a existência de uma chave, sem valor associado ou ao processar campos opcionais. Por exemplo, um campo de nome do meio pode ser deixado em branco em um formulário em alguns casos. Os pares chave-valor são sempre extensões de texto contidas no documento. Para documentos em que o mesmo valor é descrito de maneiras diferentes, por exemplo, cliente/usuário, a chave associada é cliente ou usuário (com base no contexto).
Saída JSON
A saída JSON tem três partes:
"readResults"
contém todas as marcas de texto e seleção reconhecidas. O texto é organizado por página, depois por linha, depois por palavras individuais."pageResults"
contém as tabelas e células extraídas com suas caixas delimitadoras, confiança e uma referência às linhas e palavras em readResults."documentResults"
contém os valores específicos da fatura e os itens de linha que o modelo descobriu. É onde encontrar todos os campos da fatura, como ID da fatura, enviar para, faturar para, cliente, total, itens de linha e muito mais.
Guia de migração
- Siga nosso guia de migração do Document Intelligence v3.1 para saber como usar a versão v3.0 em seus aplicativos e fluxos de trabalho.
::: Apelido-fim
Próximos passos
Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.