Modelo payStub de Inteligência Documental
O modelo payStub de Inteligência Documental combina poderosas capacidades de Reconhecimento Ótico de Caracteres (OCR) com modelos de aprendizagem profunda para analisar e extrair dados de remuneração e ganhos de recibos de vencimento. A API analisa documentos e arquivos com informações relacionadas à folha de pagamento; extrai informações importantes e retorna uma representação de dados JSON estruturada.
Caraterística | versão | Model ID |
---|---|---|
Modelo payStub | v4.0: 2024-11-30 (GA) | prebuilt-payStub.us |
Experimente a extração de dados do payStub
Os holerites são documentos essenciais emitidos pelos empregadores aos empregados, fornecendo informações sobre ganhos, deduções e salários líquidos para um período de pagamento específico. Veja como os dados são extraídos usando prebuilt-payStub.us
o modelo. Você precisa dos seguintes recursos:
Uma assinatura do Azure — você pode criar uma gratuitamente
Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.
Estúdio de Inteligência de Documentação
Na página inicial do Document Intelligence Studio, selecione payStub.
Você pode analisar o stub de pagamento de amostra ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :
Requisitos de entrada
Formatos de ficheiro suportados:
Modelo PDF Imagem: JPEG/JPG
,PNG
,BMP
,TIFF
, ,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLida ✔ ✔ ✔ Esquema ✔ ✔ ✔ Documento Geral ✔ ✔ Pré-criado ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e
4
MB para a camada gratuita (F0).As dimensões da imagem devem estar entre 50 pixels x 50 pixels e 10.000 pixels x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a cerca
8
de texto pontual a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e
1
GB para o modelo neural.Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é
1
GB com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é2
GB com um máximo de 10.000 páginas.
Idiomas e localidades suportados
Para obter uma lista completa dos idiomas suportados, consulte nossa página de suporte a idiomas de modelo pré-criados.
Extrações de campo
Para campos de extração de documentos suportados, consulte a página de esquema do modelo payStub em nosso repositório de exemplo do GitHub.
Localidades suportadas
A versão prebuilt-payStub.us suporta a localidade en-us .
Próximos passos
Experimente processar os seus próprios formulários e documentos com o Document Intelligence Studio
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.