Explore as opções do Azure AI Vision para ler texto
A IA do Azure fornece dois recursos diferentes que leem texto de documentos e imagens, um no Serviço de Visão do Azure AI e outro no Azure AI Document Intelligence. Há sobreposição no que cada serviço oferece, no entanto, cada um é otimizado para resultados dependendo do que é a entrada.
- Análise de Imagem Reconhecimento ótico de caracteres (OCR):
- Use esse recurso para documentos gerais não estruturados com menor quantidade de texto ou imagens que contenham texto.
- Os resultados são retornados imediatamente (síncronos) de uma única chamada de API.
- Tem funcionalidade para analisar imagens após extrair texto, incluindo deteção de objetos, descrever ou categorizar uma imagem, gerar miniaturas cortadas de forma inteligente e muito mais.
- Os exemplos incluem: sinais de rua, notas manuscritas e sinais de loja.
- Inteligência Documental:
- Use este serviço para ler pequenos a grandes volumes de texto de imagens e documentos PDF.
- Este serviço utiliza o contexto e a estrutura do documento para melhorar a precisão.
- A chamada de função inicial retorna um ID de operação assíncrona, que deve ser usado em uma chamada subsequente para recuperar os resultados.
- Exemplos incluem: recibos, artigos e faturas.
Você pode acessar ambas as tecnologias por meio da API REST ou de uma biblioteca de cliente. Neste módulo, vamos nos concentrar no recurso OCR na Análise de Imagem. Se você quiser saber mais sobre Document Intelligence, ler este módulo fornecerá uma boa introdução.