Modèle prédéfini de reconnaissance de texte
Le modèle de reconnaissance de texte prédéfini extrait des mots de documents et d’images et les convertit en flux de caractères lisibles par l’ordinateur. Ils utilisent une reconnaissance optique de caractères (OCR) de pointe pour détecter le texte imprimé et manuscrit dans des images.
Ce modèle traite les fichiers images et documents pour en extraire des lignes de texte imprimé ou manuscrit.
Utiliser dans Power Apps
Le modèle de reconnaissance de texte prédéfini est disponible dans Power Apps en utilisant le composant de reconnaissance de texte. Plus d’informations: Utiliser le composant de reconnaissance du texte dans Power Apps
Utiliser dans Power Automate
Pour plus d’informations sur l’utilisation de ce modèle dans Power Automate, consultez Utiliser le modèle prédéfini de reconnaissance de texte dans Power Automate.
Langues, formats et tailles pris en charge
Les fichiers que vous pouvez analyser avec le modèle de reconnaissance de texte doivent présenter les caractéristiques suivantes :
- Langue du texte imprimé : afrikaans, albanais, angika (devanagiri), arabe, asturien, awadhi-hindi (devanagiri), azerbaïdjanais (latin), bagheli, basque, biélorusse (cyrillique), biélorusse (latin), bhojpuri-hindi (devanagiri), biislama, bodo (devanagiri), bosniaque (latin), brajbha, breton, bulgare, Bundeli, bouriate (cyrillique), catalan, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), chinois (simplifié), chinois (traditionnel), cornique, corse, tatar de Crimée (latin), croate, tchèque, danois, dari, dhimal ( Devanagiri), Dogri (Devanagiri), néerlandais, anglais, Erzya (cyrillique), estonien, féroïen, fidjien, philippin, finnois, français, frioulan, Gagaouze (latin), galicien, allemand, gilbertais, gondi (Devanagiri), groenlandais, Gurung (Devanagiri), créole haïtien, Halbi (Devanagiri), Hani, Haryanvi, hawaïen, hindi, Hmong Daw (latin), Ho(Devanagiri), Hongrois, islandais, sami inari, indonésien, interlingua, inuktitut (latin), irlandais, italien, japonais, jaunsari (Devanagiri), javanais, Kabuverdianu, Kachin (latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cyrillique), Kara-Kalpak (latin), cachoube, kazakh (cyrillique), kazakh (latin), Khaling, Khasi, K’iche’, coréen, Korku, Koryak, kosraean, Kumyk (cyrillique), kurde (arabe), Kurde (latin), Kurukh (Devanagiri), Kirghize (Cyrillique), Lakota, Latin, Lituanien, Bas-Sorabe, Lule Sami, Luxembourgeois, Mahasu Pahari (Devanagiri), Malais (Latin), Maltais, Malto (Devanagiri), Manx, Maori, Marathi, Mongol (Cyrillique) ), monténégrin (cyrillique), monténégrin (latin), napolitain, népalais, niuéen, nogaï, sami du nord (latin), norvégien, occitan, ossète, pachtoune, persan, polonais, portugais, pendjabi (arabe), riverain, roumain, romanche, russe, sadri (devanagiri), samoan (latin), sanskrit (devanagari), santali (devanagiri), écossais, gaélique écossais, serbe (latin), sherpa (devanagiri), sirmauri (devanagiri), skolt sami, slovaque, slovène, Somali (arabe), du Sud Sami, espagnol, swahili (latin), suédois, tadjik (cyrillique), tatar (latin), tetum, thangmi, tonguien, turc, turkmène (latin), touvain, haut-sorabe, ourdou, ouïghour (arabe), ouzbek (arabe), Ouzbek (cyrillique), Ouzbek (latin), Volapük, Walser, Gallois, Frison occidental, Maya yucatèque, Zhuang, Zoulou
- Langue du texte manuscrit : anglais, chinois (simplifié), français, allemand, italien, japonais, coréen, portugais, espagnol
- Format :
- JPG
- PNG
- BMP
- Taille : 20 Mo maximum
- Pour les documents PDF, seules les 2,000 premières pages sont traitées.
Sortie du modèle
Si un document est détecté, le modèle de reconnaissance de texte renvoie les informations suivantes :
- Résultats : Une liste de lignes extraites du texte d’entrée.
- Texte : Chaînes contenant la ligne de texte détectée.
- BoundingBox : quatre valeurs représentant le cadre de délimitation, décrit en utilisant les positions supérieure et gauche ainsi que sa largeur et sa hauteur.
Limites
Action | Limite | Période de renouvellement |
---|---|---|
Appels de reconnaissance de texte (par environnement) | 480 | 60 secondes |