Introdução
Suponhamos que lhe são dadas milhares de imagens e que lhe pedem para transferir o texto das imagens para uma base de dados informática. As imagens digitalizadas têm texto organizado em diferentes formatos e contêm vários idiomas. Quais são algumas maneiras de concluir o projeto em um período de tempo razoável e garantir que os dados sejam inseridos com um alto grau de precisão?
Empresas de todo o mundo estão enfrentando cenários semelhantes todos os dias. Sem serviços de IA, seria um desafio concluir o projeto, especialmente se ele mudasse de escala.
Usando serviços de IA, podemos tratar este projeto como um cenário de Visão de IA do Azure e aplicar o Reconhecimento Ótico de Caracteres (OCR). O OCR permite extrair texto de imagens, como fotos de placas de rua e produtos, bem como de documentos — como documentos manuscritos ou não estruturados.
Para criar uma solução de IA automatizada, você precisa treinar modelos de aprendizado de máquina para cobrir muitos casos de uso. O serviço Azure AI Vision dá acesso a algoritmos avançados para processar imagens e devolve dados para armazenamento seguro.
Neste módulo, irá saber como:
- Identificar como o serviço Azure AI Vision permite ler texto de imagens
- Usar o serviço Azure AI Vision com SDKs e a API REST
- Desenvolver uma aplicação capaz de ler texto impresso e manuscrito