Modelo predefinido de reconhecimento de texto
O modelo predefinido de reconhecimento de texto extrai palavras de documentos e imagens em fluxos de caracteres legíveis para o computador. Eles usam o OCR (reconhecimento óptico de caracteres) de última geração para detectar textos impressos e manuscritos em imagens.
Esse modelo processa imagens e arquivos de documentos para extrair linhas de texto impresso ou manuscrito.
Uso em Power Apps
O modelo predefinido de reconhecimento de textos está disponível em Power Apps usando o componente Text Recognizer. Mais informações: Usar o componente reconhecedor de textos no Power Apps
Usar em Power Automate
Para obter informações sobre como usar este modelo no Power Automate, consulte Usar o modelo predefinido de reconhecimento de texto no Power Automate.
Idioma, formato e tamanho compatíveis
Os arquivos que você pode digitalizar com o modelo de reconhecimento de textos precisam ter estas características:
- Idioma para impressão do texto: Africâner, Albanês, Angika (Devanagiri), Árabe, Asturiano, Awadhi-Hindi (Devanagiri), Azerbaijano (Latim), Bagheli, Basco, Bielorrusso (Cirílico), Bielorrusso (Latim), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bósnio (Latim), Brajbha, Bretão, Búlgaro, Bundeli, Buryat (Cirílico), Catalão, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinês (Simplificado), Chinês (Tradicional), Cornish, Córsega, Tártaro da Crimeia (Latim), Croata, Tcheco, Dinamarquês, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Holandês, Inglês, Erzya (Cirílico), Estónio, Faroês, Fiji, Filipino, Finlandês, Francês, Friulano, Gagauz (Latim), Galego, Alemão, Gilbertês, Gondi (Devanagiri), Groenlandês, Gurung (Devanagiri), Crioulo Haitiano, Halbi (Devanagiri), Hani, Haryanvi, Havaiano, Hindi, Hmong Daw (Latim), Ho (Devanagiri), Húngaro, islandês, Inari Sami, indonésio, interlíngua, inuktitut (latim), irlandês, italiano, japonês, jaunsari (Devanagiri), Javanês, Kabuverdianu, Kachin (Latim), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cirílico), Kara-Kalpak (Latim), Kashubian, Cazaque (Cirílico), Cazaque (Latim), Khaling, Khasi, K'iche', Coreano, Korku, Koryak, Kosraean, Kumyk (Cirílico), Curdo (árabe), curdo (latim), Kurukh (Devanagiri), Quirguistão (Cirílico), Lakota, Latim, Lituano, Baixo Sorbio, Lule Sami, Luxemburguês, Mahasu Pahari (Devanagiri), Malaio (Latim), Maltês, Malto (Devanagiri), Manx, Maori, Marathi, Mongol (Cirílico ), montenegrino (cirílico), montenegrino (latim), napolitano, nepalês, niueano, Nogay, Sami do Norte (latim), norueguês, occitano, ossético, pashto, persa, polonês, português, punjabi (árabe), ripuariano, romeno, romanche, russo, sadri (devanagiri), samoano (latim), sânscrito (devanagari), Santali (Devanagiri), escocês, gaélico escocês, sérvio (latim), sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, eslovaco, esloveno, somali (árabe), sami do sul, espanhol, suaíli (latim), sueco, tadjique (cirílico), tártaro (latim), tétum, thangmi, tonganês, turco, turcomano (latim), tuvano, alto sorábio, urdu, uigur (árabe), Uzbeque (árabe), Uzbeque (cirílico), Uzbeque (latim), Volapük, Walser, Galês, Frísio Ocidental, Maia Iucateca, Zhuang, Zulu
- Idioma para texto manuscrito: Inglês, Chinês (Simplificado), Francês, Alemão, Italiano, Japonês, Coreano, Português, Espanhol
- Formato:
- JPG
- PNG
- BMP
- Tamanho: máximo de 20 MB
- Para documentos em PDF, apenas as 2,000 primeiras páginas são processadas.
Saída do modelo
Se um documento for detectado, o modelo de reconhecimento de texto produzirá as seguintes informações:
- Resultados: Uma lista de linhas extraídas do texto de entrada.
- Texto: Strings contendo a linha de texto detectada.
- BoundingBox: Quatro valores que representam a caixa delimitadora, descritos usando as posições superior e esquerda, juntamente com sua largura e altura.
Limites
Ação | Limite | Período de renovação |
---|---|---|
Chamadas de reconhecimento de texto (por ambiente) | 480 | 60 segundos |