Compartilhar via


Modelo de contracheque do Document Intelligence

O modelo payStub da Document Intelligence combina recursos poderosos de reconhecimento óptico de caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair dados de remuneração e ganhos de recibos de pagamento. A API analisa documentos e arquivos com informações relacionadas à folha de pagamento; extrai informações importantes e retorna uma representação de dados JSON estruturada.

Recurso version ID do Modelo
modelo payStub v4.0: 2024-11-30 (GA) prebuilt-payStub.us

Experimente a extração de dados do payStub

Os pagamentos são documentos essenciais emitidos pelos empregadores aos funcionários, fornecendo ganhos, deduções e informações de pagamento líquido por um período de pagamento específico. Veja como os dados são extraídos usando o modelo prebuilt-payStub.us. Você precisa dos seguintes recursos:

  • Uma assinatura do Azure – você pode criar uma gratuitamente

  • Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

    Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Estúdio de Informação de Documentos

  1. Na página inicial do Estúdio da Informação de Documentos, selecione payStub.

  2. Você pode analisar o stub de pagamento de exemplo ou carregar seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

Requisitos de entrada

  • Formatos de arquivo com suporte:

    Modelar PDF Image,:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Ler
    Layout
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada
  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente 8 pontos de texto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.

    • Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de 1 GB, com um máximo de 10.000 páginas. Para 2024-11-30 (GA), o tamanho total dos dados de treinamento é 2 GB com um máximo de 10.000 páginas.

Idiomas e localidades com suporte

Para uma lista completa de idiomas com suporte, confira nossa página de suporte de idiomas de modelos predefinidos.

Extrações de campo

Para campos de extração de documentos suportados, veja a página esquema do modelo payStub em nosso repositório de exemplos do GitHub.

Localidades com suporte

A versão prebuilt-payStub.us suporta o idioma en-us.

Próximas etapas