Partilhar via


Modelo pré-criado de reconhecimento de texto

Os modelos pré-criado de reconhecimento de texto extrai palavras de documentos e imagens para fluxos de carateres legíveis por computador. O modelo utiliza o reconhecimento ótico de carateres (OCR) de última geração para detetar texto impresso e manuscrito em imagens.

Este modelo processa imagens e ficheiros de texto para extrair linhas de texto impresso ou manuscrito.

Utilizar no Power Apps

O modelo pré-criado de reconhecimento de texto está disponível no Power Apps ao utilizar o componente de reconhecimento de texto. Mais informações:Utilizar o componente de reconhecimento de texto no Power Apps

Utilizar no Power Automate

Para obter informações sobre como utilizar este modelo no Power Automate, consulte Utilizar o modelo pré-criado de reconhecimento de texto no Power Automate.

Idioma, formatos e dimensões de dados suportados

Os ficheiros que pode analisar com o modelo de reconhecimento de texto têm de ter as seguintes características:

  • Língua para impressão do texto: africâner, albanês, angika (Devanagiri), árabe, asturano, awadhi-hindi (Devanagiri), azeri (latim), bagheli, basco, bielorrusso (cirílico), bielorrusso (latim), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bósnio (latim), brajbha, bretão, búlgaro, bundeli, buryat (cirílico), catalão, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), chinês (simplificado), chinês (tradicional), córnico, corso, tártaro da Crimeia (latim), croata, checo, Dinamarquês, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Neerlandês, Inglês, Erzya (cirílico), estónio, Faroês, Fijiano, Filipino, Finlandês, Francês, Friuliano, Gagauz (Latim), Galego, Alemão, Gilbertese, Gondi (Devanagiri), Gronelandês, Gurung (Devanagiri), Crioulo Haitiano, Halbi (Devanagiri), Hani, Haryanvi, Havaiano, Hindi, Hmong Daw (Latim), Ho(Devanagiri), Húngaro, Islandês, Inari Sami, Indonésio, Interlíngua, Inuktitut (Latim), Irlandês, Italiano, Japonês, Jaunsari (Devanagiri), Javanês, Kabuverdianu, Kachin (latim), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cirílico), Kara-Kalpak (latim), Kashubian, Cazaque (cirílico), cazaque (latim), Khaling, Khasi, K'iche', coreano, Korku, Koryak, Kosraean, Kumyk (cirílico), curdo (árabe), curdo (latino), Kurukh (Devanagiri), quirguiz (cirílico), lakota, latim, lituano, baixo sórbio, Lule Sami, luxemburguês, Mahasu Pahari (Devanagiri), malaio (latim), maltês, Malto (Devanagiri), Manx, maori, marati, mongol (cirílico), Montenegrino (cirílico), montenegrino (latim), napolitano, nepalês, niueano, nogay, sami do norte (latim), norueguês, occitano, ossético, pashto, persa, polonês, português, punjabi (árabe), ripuariano, romeno, romanche, russo, Sadri (Devanagiri), samoano (latim), sânscrito (Devanagari), Santali (Devanagiri), escocês, gaélico escocês, sérvio (latim), sherpa (Devanagiri), sirmauri (Devanagiri), Skolt Sami, eslovaco, esloveno, somali (árabe), Sami do Sul, espanhol, suaíli (latim), sueco, tajique (cirílico), tártaro (latim), tétum, thangmi, tonganês, turcomeno (latim), tuvan, alto sórbio, urdu, uigur (árabe), uzbeque (árabe), uzbeque (cirílico), uzbeque (latim), volapük, walser, galês, frísio ocidental, maia iucateca, zhuang, zulu
  • Idioma para texto manuscrito: Inglês, Chinês (Simplificado), Francês, Alemão, Italiano, Japonês, Coreano, Português, Espanhol
  • Formato:
    • JPG
    • PNG
    • BMP
    • PDF
  • Tamanho: máximo de 20 MB
  • Para documentos PDF, apenas as primeiras 2,000 páginas são processadas.

Saída do modelo

Se for detetado um documento, o modelo de reconhecimento de texto apresenta as seguintes informações:

  • Resultados: Uma lista de linhas extraídas do texto de entrada.
  • Texto: Strings que contêm a linha de texto detetada.
  • BoundingBox: Quatro valores que representam a caixa delimitadora, descritos usando as posições superior e esquerda, juntamente com sua largura e altura.

Limites

Ação Limite Período de renovação
Chamadas de reconhecimento de texto (por ambiente) 480 60 segundos

Preparação: Reconhecer texto com o AI Builder (módulo)