Sprachunterstützung: benutzerdefinierte Modelle
Dieser Inhalt gilt für: Version 4.0 (GA) | Vorherige Versionen: Version 3.1 (GA) Version 3.0 (GA) Version 2.1 (GA)
Dieser Inhalt gilt für: Version 3.1 (GA) | Aktuelle Version: Version 4.0 (GA) | Vorherige Versionen: Version 3.0 Version 2.1
Dieser Inhalt gilt für: Version 3.0 (GA) | Aktuelle Versionen: Version 4.0 (GA) Version 3.1 | Vorherige Version: Version 2.1
Dieser Inhalt gilt für: Version 2.1 | Neueste Version: Version 4.0 (GA)
Azure KI Dokument Intelligenz-Modelle bieten Unterstützung für mehrsprachige Dokumentverarbeitung. Unsere Sprachunterstützungsfunktionen ermöglichen es Ihren Benutzern, auf natürliche Weise mit Ihren Anwendungen zu kommunizieren und die globale Reichweite zu erhöhen. Benutzerdefinierte Modelle werden mithilfe Ihrer beschrifteten Datasets trainiert, um unterschiedliche Daten aus strukturierten, halbstrukturierten und unstrukturierten Formularen und Dokumenten zu extrahieren, die für Ihre Anwendungsfälle spezifisch sind. Eigenständige benutzerdefinierte Modelle können kombiniert werden, um zusammengestellte Modelle zu erstellen. Die folgenden Tabellen enthalten die verfügbare Sprach- und Gebietsschemaunterstützung nach Modell und Feature:
Benutzerdefinierter Klassifizierer
Sprache – Gebietsschemacode | Standard |
---|---|
Englisch (USA) – en-US | Englisch (USA) – en-US |
Sprache | Code (optional) |
---|---|
Afrikaans | af |
Albanisch | sq |
Arabisch | ar |
Bulgarisch | bg |
Chinesisch (Han (vereinfachte Variante)) | zh-Hans |
Chinesisch (Han (traditionelle Variante)) | zh-Hant |
Kroatisch | hr |
Tschechisch | cs |
Dänisch | da |
Niederländisch | nl |
Estnisch | et |
Finnisch | fi |
Französisch | fr |
Deutsch | de |
Hebräisch | he |
Hindi | hi |
Ungarisch | hu |
Indonesisch | id |
Italienisch | it |
Japanisch | ja |
Koreanisch | ko |
Lettisch | lv |
Litauisch | lt |
Mazedonisch | mk |
Marathi | mr |
Neugriechisch (1453-) | el |
Nepali (Makrosprache) | ne |
Norwegisch | no |
Panjabi | pa |
Persisch | fa |
Polnisch | pl |
Portugiesisch | pt |
Rumänisch | rm |
Russisch | ru |
Slowakisch | sk |
Slowenisch | sl |
Somali (Arabisch) | so |
Somali (Lateinische Schrift) | so-latn |
Spanisch | es |
Swahili (Makrosprache) | sw |
Schwedisch | sv |
Tamilisch | ta |
Thailändisch | th |
Türkisch | tr |
Ukrainisch | uk |
Urdu | ur |
Vietnamesisch | vi |
Benutzerdefiniertes neuronales Modell
In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.
Sprache | Code (optional) |
---|---|
Afrikaans | af |
Albanisch | sq |
Arabisch | ar |
Bulgarisch | bg |
Chinesisch (vereinfacht) | zh-Hans |
Chinesisch (traditionell) | zh-Hant |
Kroatisch | hr |
Tschechisch | cs |
Dänisch | da |
Niederländisch | nl |
Englisch | en |
Estnisch | et |
Finnisch | fi |
Französisch | fr |
Deutsch | de |
Hebräisch | he |
Hindi | hi |
Ungarisch | hu |
Indonesisch | id |
Italienisch | it |
Japanisch | ja |
Koreanisch | ko |
Lettisch | lv |
Litauisch | lt |
Mazedonisch | mk |
Marathi | mr |
Neugriechisch (1453-) | el |
Nepali (Makrosprache) | ne |
Norwegisch | no |
Panjabi | pa |
Persisch | fa |
Polnisch | pl |
Portugiesisch | pt |
Rumänisch | rm |
Russisch | ru |
Slowakisch | sk |
Slowenisch | sl |
Somali (Arabisch) | so |
Somali (Lateinische Schrift) | so-latn |
Spanisch | es |
Swahili (Makrosprache) | sw |
Schwedisch | sv |
Tamilisch | ta |
Thailändisch | th |
Türkisch | tr |
Ukrainisch | uk |
Urdu | ur |
Vietnamesisch | vi |
Benutzerdefiniertes Vorlagenmodell
In der folgenden Tabelle sind die unterstützten Sprachen für gedruckten Text aufgeführt.
Sprache | Code (optional) |
---|---|
Abasisch | abq |
Abchasische Sprache | ab |
Achinesisch | ace |
Acholi | ach |
Adangme | ada |
Adygeisch | ady |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanisch | sq |
Algonkin | alq |
Angika (Devanagari) | anp |
Arabisch | ar |
Asturisch | ast |
Asu (Tansania) | asa |
Avar | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Aserbaidschanisch (Lateinisch) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Baschkirisch | ba |
Baskisch | eu |
Belarussisch (Kyrillisch) | be, be-cyrl |
Belarussisch (Lateinisch) | be, be-latn |
Bemba (Sambia) | bem |
Bena (Tansania) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bosnisch (Lateinisch) | bs |
Brajbha | bra |
Bretonisch | br |
Bulgarisch | bg |
Bundeli | bns |
Burjatisch (Kyrillisch) | bua |
Katalanisch | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Tschetschenisch | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chinesisch (vereinfacht) | zh-Hans |
Chinesisch (traditionell) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Tschuwaschische | cv |
Kornisch | kw |
Korsisch | co |
Cree | cr |
Creek | mus |
Krimtatarisch (Lateinisch) | crh |
Kroatisch | Std. |
Crow | cro |
Tschechisch | cs |
Dänisch | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dunganisch | dng |
Niederländisch | nl |
Efik | efi |
English | en |
Ersjanisch (Kyrillisch) | myv |
Estnisch | et |
Färöisch | fo |
Fidschi | fj |
Filipino | fil |
Finnisch | fi |
Sprache | Code (optional) |
---|---|
Fon | fon |
Französisch | fr |
Friaulisch | fur |
Ga | gaa |
Gagausisch (Lateinisch) | gag |
Galicisch | gl |
Ganda | lg |
Gayo | gay |
Deutsch | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Griechisch | el |
Grönländisch | kl |
Guaraní | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Haitianisches Kreolisch | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaiianisch | haw |
Hebräisch | er |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Lateinisch) | mww |
Ho (Devanagiri) | hoc |
Ungarisch | hu |
Iban | iba |
Isländisch | stimmt |
Igbo | ig |
Iloko | ilo |
Inari-Samisch | smn |
Indonesisch | id |
Inguschisch | inh |
Interlingual | ia |
Inuktitut (Lateinisch) | iu |
Irisch | ga |
Italienisch | it |
Japanisch | ja |
Jaunsari (Devanagari) | Jns |
Javanisch | jv |
Jola-Fonyi | dyo |
Kabardinisch | kbd |
Kabuverdianu | kea |
Kachin (Lateinisch) | kac |
Kalenjin | kln |
Kalmückisch | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karatschai-Balkarisch | krc |
Karakalpakisch (Kyrillisch) | kaa-cyrl |
Karakalpakisch (Lateinisch) | kaa |
Kaschubisch | csb |
Kasachisch (Kyrillisch) | kk-cyrl |
Kasachisch (Lateinisch) | kk-latn |
Chakassisch | kjh |
Khaling | klr |
Khasi | kha |
K'iche' | quc |
Kikuyu | ki |
Kildinsamisch | sjd |
Kinyarwanda | rw |
Komi | kv |
Kikongo | kg |
Koreanisch | ko |
Korku | kfq |
Korjakisch | kpy |
Kosraeanisch | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumykisch (Kyrillisch) | kum |
Kurdisch (arabisch) | ku-arab |
Kurdisch (lateinisch) | ku-latn |
Kurukh (Devanagari) | kru |
Kirgisisch (Kyrillisch) | ky |
Lak | lbe |
Lakota | lkt |
Sprache | Code (optional) |
---|---|
Lateinisch | la |
Lettisch | lv |
Lezghian | lex |
Lingala | ln |
Litauisch | lt |
Niedersorbisch | dsb |
Lozi | loz |
Lule-Samisch | smj |
Luo (Kenia und Tansania) | luo |
Luxemburgisch | lb |
Luhyia | luy |
Mazedonisch | mk |
Machame | jmc |
Maduresisch | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Madagassisch | mg |
Malaiisch (Lateinisch) | ms |
Maltesisch | Mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marathi | mr |
Mari (Russland) | chm |
Maa | mas |
Mende (Sierra Leone) | men (Männer) |
Meru | mer |
Meta' | mgo |
Minangkabau | Min |
Mohawk | moh |
Mongolisch (Kyrillisch) | mn |
Mongondow | mog |
Montenegrinisch (Kyrillisch) | cnr-cyrl |
Montenegrinisch (Lateinisch) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Neapolitanisch | nap |
Nepalesisch | ne |
Ngomba | jgo |
Niue | niu |
Nogaisch | nog |
Nord-Ndebele | nd |
Nordsamisch (Lateinisch) | sme |
Norwegisch | Nein |
Nyanja | ny |
Nkore | nyn |
Nzima | nzi |
Okzitanisch | oc |
Ojibwa | oj |
Oromo | om |
Ossetisch | os |
Pampanga | pam |
Pangasinensisch | pag |
Papiamento | pap |
Paschtu | ps |
Pedi | nso |
Persisch | fa |
Polnisch | pl |
Portugiesisch (Portugal) | pt |
Punjabi (Arabisch) | pa |
Quechua | qu |
Ripuarisch | ksh |
Rumänisch | ro |
Rätoromanisch | rm |
Rundi | rn |
Russisch | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoanisch (Lateinisch) | sm |
Sango | sg |
Sprache | Code (optional) |
---|---|
Sangu (Gabun) | snq |
Sanskrit (Devanagari) | sa |
Santali (Devanagiri) | sat |
Schotten | sco |
Schottisch-Gälisch | gd |
Sena | seh |
Serbisch (Kyrillisch) | sr-cyrl |
Serbisch (Lateinisch) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt-Samisch | sms |
Slowakisch | sk |
Slowenisch | sl |
Soga | xog |
Somali (Arabisch) | SO |
Somali (Lateinische Schrift) | so-latn |
Songhai | son |
Süd-Ndebele | nr |
Südliches Altaisch | alt |
Südsamisch | sma |
Südliches Sotho | st |
Spanisch | es |
Sundanesisch | su |
Suaheli (Lateinisch) | sw |
Siswati | ss |
Schwedisch | sv |
Tabassaran | Tabulatorzeichen |
Taschelhit | shi |
Tahitisch | ty |
Taita | dav |
Tadschikisch (Kyrillisch) | tg |
Tamilisch | ta |
Tatar (Kyrillisch) | tt-cyrl |
Tatarisch (Lateinisch) | tt |
Teso | teo |
Tetum | tet |
Thailändisch | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongaisch | Bis |
Xitsonga | ts |
Setswana | tn |
Türkisch | tr |
Turkmenisch (Lateinisch) | tk |
Tuwinisch | tyv |
Udmurtisch | udm |
Uigurisch (Kyrillisch) | ug-cyrl |
Ukrainisch | uk |
Obersorbisch | hsb |
Urdu | ur |
Uigurisch (Arabisch) | ug |
Usbekisch (Arabisch) | uz-arab |
Usbekisch (kyrillisch) | uz-cyrl |
Usbekisch (Lateinisch) | uz |
Vietnamesisch | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Walisisch | cy |
Westfriesisch | fy |
Wolof | wo |
Xhosa | xh |
Yukatekisches Maya | yua |
Zapotekisch | zap |
Djerma | dje |
Zhuang | za |
Zulu | zu |