Modelo de extrato bancário de Document Intelligence

Artigo
12/12/2024

O modelo de extrato bancário Document Intelligence combina poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair dados de extratos bancários dos EUA. A API analisa extratos bancários impressos; extrai informações importantes, como número da conta, dados bancários, detalhes do extrato, detalhes da transação e taxas; e retorna uma representação de dados JSON estruturada. Com a V4.0 GA, agora você pode extrair tabelas de verificação nos extratos bancários dos EUA.

Caraterística	versão	Model ID
Modelo de extrato bancário	v4.0: 2024-11-30 (GA)	`prebuilt-bankStatement.us`

Extração de dados do extrato bancário

Um extrato bancário ajuda a analisar as atividades da conta durante um período especificado. É um comunicado oficial que ajuda na deteção de fraudes, rastreamento de despesas, erros contábeis e registro das atividades do período. Veja como os dados são extraídos usando o prebuilt-bankStatement.us modelo. Você precisa dos seguintes recursos:

Uma assinatura do Azure — você pode criar uma gratuitamente
Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Estúdio de Inteligência de Documentação

Na página inicial do Document Intelligence Studio, selecione extratos bancários.
Você pode analisar o extrato bancário de amostra ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

Experimente o Document Intelligence Studio

Requisitos de entrada

Formatos de ficheiro suportados:

Modelo	PDF	Imagem: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, , `HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Lida	✔	✔	✔
Esquema	✔	✔	✔
Documento Geral	✔	✔
Pré-criado	✔	✔
Extração personalizada	✔	✔
Classificação personalizada	✔	✔	✔

Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a cerca 8 de texto pontual a 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
- Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1 GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é 2 GB com um máximo de 10.000 páginas.

Idiomas e localidades suportados

Para obter uma lista completa dos idiomas suportados, consulte nossa página de suporte a idiomas de modelo pré-criados.

Extrações de campo

Para campos de extração de documentos suportados, consulte a página de esquema do modelo de extrato bancário em nosso repositório de exemplo do GitHub.

Localidades suportadas

A versão prebuilt-bankStatement.us 2027-11-30 suporta a localidade en-us .

Próximos passos

Experimente processar os seus próprios formulários e documentos com o Document Intelligence Studio
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Partilhar via