Modelo de certidão de casamento de Informação de Documentos
Este conteúdo se aplica a: v4.0 (versão prévia)
O modelo de certidão de casamento de Informação de Documentos usa recursos poderosos de reconhecimento óptico de caracteres (OCR) para analisar e extrair campos-chave de certidões de casamento. As certidões de casamento podem ter vários formatos e qualidades, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como nomes dos cônjuges, data de emissão e local de casamento; e retorna uma representação estruturada de dados JSON. Atualmente, o modelo dá suporte a formatos de documento em inglês.
Processamento automatizado de certidão de casamento
O processamento automatizado de certidões de casamento é o processo de extração de campos-chave das certidões de casamento. Historicamente, o processo de análise da certidão de casamento é feito manualmente e, portanto, muito demorado. A extração precisa de dados importantes de certidões de casamento é normalmente a primeira e uma das etapas mais críticas no processo de automação de certidões de casamento.
Opções de desenvolvimento
A Informação de Documentos v4.0 (2024-07-31-preview) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos | ID do Modelo |
---|---|---|
prebuilt-marriageCertificate.us | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Python • SDK do Java • SDK do JavaScript |
prebuilt-marriageCertificate.us |
Requisitos de entrada
Formatos de arquivo com suporte:
Modelar PDF Image,: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento geral ✔ ✔ Predefinida ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e
4
MB para a camada gratuita (F0).As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente
8
pontos de texto a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e
1
GB para o modelo neural.Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de
1
GB, com um máximo de 10.000 páginas. Na 07-31-2024-versão prévia e posterior, o tamanho total dos dados de treinamento é2
GB com um máximo de 10.000 páginas.
Experimente a extração de dados de documentos de certidão de casamento
Para ver como funciona a extração de dados para o serviço de cartão de certidão de casamento, você precisa dos seguintes recursos:
Uma assinatura do Azure: você pode criar uma gratuitamente.
Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.
Estúdio de Informação de Documentos
Na página inicial do Estúdio da Informação de Documentos, selecione Certificado de Casamento.
Você pode analisar os exemplos de certidões de casamento ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :
Idiomas e localidades com suporte
Confira nossa página Suporte ao idioma – modelos predefinidos, para obter uma lista completa dos idiomas compatíveis.
Extração de campo
A seguir estão os campos extraídos de uma certidão de casamento na resposta de saída JSON.
Nome | Tipo | Descrição | Saída de exemplo |
---|---|---|---|
Spouse1FirstName |
String | Nome do cônjuge 1 | Wesley |
Spouse1MiddleName |
String | Nome do meio do cônjuge 1 | M. |
Spouse1LastName |
String | Sobrenome do cônjuge 1 | Perry |
Spouse1Age |
Inteiro | Idade do cônjuge 1 | 26 |
Spouse1BirthDate |
Data | Data de nascimento do cônjuge 1 | 16 de novembro de 1997 |
Spouse1Address |
Address | Endereço do cônjuge 1 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | Local de nascimento do cônjuge 1 | Michigan |
Spouse2FirstName |
String | Nome do cônjuge 2 | Beth |
Spouse2MiddleName |
String | Nome do meio do cônjuge 2 | R. |
Spouse2LastName |
String | Sobrenome do cônjuge 2 | Julio |
Spouse2Age |
Inteiro | Idade do cônjuge 2 | 23 |
Spouse2BirthDate |
Data | Data de nascimento do cônjuge 2 | Jul. 22, 2000 |
Spouse2Address |
Address | Endereço do cônjuge 2 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | Local de nascimento do cônjuge 2 | Wisconsin |
DocumentNumber |
String | Número do documento | 01976/202 |
IssueDate |
Data | Data de emissão do certificado | 10 de outubro de 2023 |
IssuePlace |
String | Local de emissão do certificado | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
Data | Data do casamento | 10 de outubro de 2023 |
MarriagePlace |
String | Lugar do casamento | 105 Coal Street, Galloway, Wisconsin 54432 |
Os pares de valores-chave da certidão de casamento e os itens de linha extraídos estão na seção documentResults
da saída JSON.
Próximas etapas
Experimente processar seus próprios formulários e documentos com o Estúdio da Informação de Documentos.
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.