Modelo de cartão de visita da Informação de Documentos

Artigo
11/19/2024

Importante

A partir do Document Intelligence v4.0 e daí em diante, o modelo de cartão de visita (prebuilt-businessCard) foi preterido. Para extrair dados de formatos de cartão de visitas, use o seguinte:

Recurso	version	ID do Modelo
Modelo de cartão de visita	• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA)	`prebuilt-businessCard`

Este conteúdo se aplica a: v3.1 (GA) | Versões anteriores: v3.0 v2.1

Esse conteúdo se aplica a: v3.0 (GA) | Últimas versões: v4.0 (GA) v3.1 | Versão anterior: v2.1

[!INCLUDE [aplica-se a v2.1]../(includes/applies-to-v21.md)]

O modelo de cartão de visita da Informação de Documentos combina funcionalidades avançadas de Reconhecimento Óptico de Caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair dados de imagens de cartões de visita. A API analisa cartões de visita impressos, extrai informações importantes, como nome, sobrenome, nome da empresa, endereço de email e número de telefone e retorna uma representação de dados JSON estruturada.

Extração de dados de cartão de visita

Os cartões de visita são uma ótima forma de representar um negócio ou um profissional. O logotipo da empresa, as fontes e as imagens em segundo plano encontrados em cartões de visita ajudam a empresa a criar uma identidade visual e se destacar das outras. A aplicação de técnicas baseadas em OCR e machine learning para automatizar a verificação de cartões de visita é um cenário comum de processamento de imagens. Os sistemas empresariais usados pelas equipes de vendas e marketing normalmente têm a funcionalidade de extração de dados de cartão de visita integrada para o benefício dos usuários.

Cartão de visita de exemplo processado com o Estúdio de Informação de Documentos

Cartão de visita de exemplo processado com a ferramenta de Rotulagem de Exemplo da Informação de Documentos

Captura de tela de um cartão de visita de exemplo analisado com a ferramenta de rotulagem de exemplo da Informação de Documentos.

Opções de desenvolvimento

A Informação de Documentos v3.1:2023-07-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso	Recursos	ID do Modelo
Modelo de cartão de visita	• Estúdio da Informação de Documentos • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-businessCard

A Informação de Documentos v3.0:2022-08-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso	Recursos	ID do Modelo
Modelo de cartão de visita	• Estúdio da Informação de Documentos • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-businessCard

A Informação de Documentos v2.1 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso	Recursos
Modelo de cartão de visita	• Ferramenta de rotulagem da Informação de Documentos • API REST SDK da biblioteca de clientes • Contêiner do Docker da Informação de Documentos

Experimentar a extração de dados de cartão de visita

Veja como os dados, incluindo nome, cargo, endereço, email e nome da empresa, são extraídos de cartões de visita. Você precisa dos seguintes recursos:

Uma assinatura do Azure – você pode criar uma gratuitamente
Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Estúdio de Informação de Documentos

Observação

O Estúdio de Informação de Documentos está disponível com as APIs v3.1 e v3.0.

Na home page do Estúdio de Informação de Documentos, selecione Cartões de visita.
Você pode analisar o modelo de cartão de visita ou carregar seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

Experimente o Estúdio de Informação de Documentos

Ferramenta de Rotulagem de Amostra da Informação de Documentos

Navegue até a Ferramenta de Exemplo da Informação de Documentos.
Na página inicial da ferramenta de exemplos, selecione o bloco Usar modelo predefinido para obter dados.
Selecione o Tipo de Formulário que deseja analisar no menu suspenso.
Escolha um URL para o arquivo que você gostaria de analisar, usando as opções abaixo:
No campo Origem , selecione URL no menu suspenso, cole a URL selecionada e selecione o botão Buscar.
No campo Ponto de extremidade do serviço Informação de Documentos, cole o ponto de extremidade obtido com a assinatura da Informação de Documentos.
No campo chave, cole a chave obtida do recurso Informação de Documentos.
Selecione Executar análise. A ferramenta de rotulagem de exemplo da Informação de Documentos chamará a API predefinida Analisar e analisará o documento.
Veja os resultados: confira os pares chave-valor extraídos, os itens de linha, o texto realçado extraído e as tabelas detectadas.

Observação

A ferramenta de Rotulagem de Exemplo não é compatível com o formato de arquivo BMP. Essa é uma limitação da ferramenta, não do Serviço de Inteligência de Documentos.

Requisitos de entrada

Formatos de arquivo com suporte:

Modelar	PDF	Image,: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Ler	✔	✔	✔
Layout	✔	✔	✔
Documento geral	✔	✔
Predefinida	✔	✔
Extração personalizada	✔	✔
Classificação personalizada	✔	✔	✔

Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.
Para PDF e TIFF, até 2.000 páginas podem ser processadas (com uma assinatura de camada gratuita, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a aproximadamente 8 pontos de texto a 150 pontos por polegada (DPI).
Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
- Para o treinamento do modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1 GB para o modelo neural.
- Para o treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é de 1 GB, com um máximo de 10.000 páginas. Para a versão 2024-11-30 (GA), o tamanho total dos dados de treinamento é de 2 GB com um máximo de 10.000 páginas.

Os formatos de arquivo compatíveis: JPEG, PNG, PDF e TIFF
Em PDF e TIFF, até 2.000 páginas são processadas. Para assinantes de camada gratuita, somente as duas primeiras páginas são processadas.
O tamanho do arquivo precisa ser menor que 50 MB e ter as dimensões mínima de 50 x 50 pixels e máxima de 10.000 x 10.000 pixels.

Idiomas e localidades com suporte

Para uma lista completa de idiomas com suporte, confira nossa página de suporte de idiomas de modelos predefinidos.

Extrações de campo

Para os campos de extração de documentos com suporte, confira a página do esquema do modelo de cartão de visita em nosso repositório de amostras do GitHub.

Campos extraídos

Nome	Tipo	Descrição	Texto
ContactNames	matriz de objetos	Nome do contato extraído do cartão de visita	[{ "FirstName": "John"`,` "LastName": "Doe" }]
FirstName	string	Nome do contato	"John"
LastName	string	Sobrenome do contato	"Doe"
CompanyNames	Matriz de cadeias de caracteres	Nome da empresa extraído do cartão de visita	["Contoso"]
Departments	Matriz de cadeias de caracteres	Departamento ou organização de contato	["R&D"]
JobTitles	Matriz de cadeias de caracteres	Cargo do contato listado	["Software Engineer"]
Emails	Matriz de cadeias de caracteres	Email do contato extraído do cartão de visita	["johndoe@contoso.com"]
Sites	Matriz de cadeias de caracteres	Site extraído do cartão de visita	["https://www.contoso.com"]
Endereços	Matriz de cadeias de caracteres	Endereço extraído do cartão de visita	["123 Main Street, Redmond, Washington 98052"]
MobilePhones	Matriz de números de telefone	Número de telefone celular extraído do cartão de visita	["+19876543210"]
Faxes	Matriz de números de telefone	Número de fax extraído do cartão de visita	["+19876543211"]
WorkPhones	Matriz de números de telefone	Número de telefone comercial extraído do cartão de visita	["+19876543231"]
OtherPhones	Matriz de números de telefone	Outro número de telefone extraído do cartão de visita	["+19876543233"]

Localidades com suporte

Os cartões de visita predefinidos v2.1 são compatíveis com as seguintes localidades:

en-US
en-au
en-ca
en-gb
en-in

Guia de migração e API REST v3.1

Siga nosso Guia de migração da Informação de Documentos v3.1 para saber como usar a versão v3.0 em seus aplicativos e fluxos de trabalho.

Próximas etapas

Experimente processar seus próprios formulários com o Estúdio de Informação de Documentos
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Experimente processar seus próprios formulários com a Amostra de ferramenta de rotulagem Estúdio de Informação de Documentos
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.

Compartilhar via