Suporte ao idioma: modelos personalizados
Artigo 12/16/2024
1 colaborador
Comentários
Neste artigo
Esse conteúdo se aplica a: v2.1 | Última versão: v4.0 (GA)
Os modelos da IA do Azure para Informação de Documentos fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de documentos estruturados, semiestruturados e não estruturados específicos para seus casos de uso. Modelos personalizados autônomos podem ser combinados para criar modelos compostos. As tabelas a seguir listam o suporte ao idioma e local disponíveis por modelo e recurso:
Classificador personalizado
Idioma — código de localidade
Padrão
Inglês (Estados Unidos)—en-US
Inglês (Estados Unidos)—en-US
Idioma
Código (opcional)
Africâner
af
Albanês
sq
Árabe
ar
Búlgaro
bg
Chinês (Han (variante simplificada))
zh-Hans
Chinês (Han (variante tradicional))
zh-Hant
Croata
hr
Tcheco
cs
Dinamarquês
da
Holandês
nl
Estoniano
et
Finlandês
fi
Francês
fr
Alemão
de
Hebraico
he
Híndi
hi
Húngaro
hu
Indonésio
id
Italiano
it
Japonês
ja
Coreano
ko
Letão
lv
Lituano
lt
Macedônio
mk
Marati
mr
Grego Moderno (1453-)
el
Nepalês (macrolíngua)
ne
Norueguês
no
Panjabi
pa
Persa
fa
Polonês
pl
Português
pt
Romeno
rm
Russo
ru
Eslovaco
sk
Esloveno
sl
Somali (árabe)
so
Somali (latino)
so-latn
Espanhol
es
Swahili (macrolíngua)
sw
Sueco
sv
Tâmil
ta
Tailandês
th
Turco
tr
Ucraniano
uk
Urdu
ur
Vietnamita
vi
Neural personalizado
A tabela a seguir lista os idiomas com suporte para texto impresso.
Idioma
Código (opcional)
Africâner
af
Albanês
sq
Árabe
ar
Búlgaro
bg
Chinês simplificado
zh-Hans
Chinês tradicional
zh-Hant
Croata
hr
Tcheco
cs
Dinamarquês
da
Holandês
nl
Inglês
en
Estoniano
et
Finlandês
fi
Francês
fr
Alemão
de
Hebraico
he
Híndi
hi
Húngaro
hu
Indonésio
id
Italiano
it
Japonês
ja
Coreano
ko
Letão
lv
Lituano
lt
Macedônio
mk
Marati
mr
Grego Moderno (1453-)
el
Nepalês (macrolíngua)
ne
Norueguês
no
Panjabi
pa
Persa
fa
Polonês
pl
Português
pt
Romeno
rm
Russo
ru
Eslovaco
sk
Esloveno
sl
Somali (árabe)
so
Somali (latino)
so-latn
Espanhol
es
Swahili (macrolíngua)
sw
Sueco
sv
Tâmil
ta
Tailandês
th
Turco
tr
Ucraniano
uk
Urdu
ur
Vietnamita
vi
A tabela a seguir lista os idiomas com suporte para extração de textos manuscritos .
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Modelo personalizado
A tabela a seguir lista os idiomas com suporte para texto impresso .
Idioma
Código (opcional)
Abaza
abq
Abecásia
ab
Achinese
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Afar
aa
Africâner
af
Akan
ak
Albanês
sq
Algonquin
alq
Angika (Devanagari)
anp
Árabe
ar
Asturiano
ast
Asu (Tanzânia)
asa
Avaric
av
Awadhi-Hindi (Devanagari)
awa
Aimará
ay
Azerbaidjano (Latino)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Bashkir
ba
Basco
eu
bielorrusso (cirílico)
be, be-cyrl
bielorrusso (latino)
be, be-latn
Bemba (Zâmbia)
bem
Bena (Tanzânia)
bez
Bhojpuri-Hindi (Devanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Devanagari)
brx
Bósnio (latim)
bs
Brajbha
bra
Bretão
br
Búlgaro
bg
Bundeli
bns
buryat (cirílico)
bua
Catalão
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Checheno
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Chinês simplificado
zh-Hans
Chinês (tradicional)
zh-Hans
Choctaw
cho
Chukot
ckt
Chuvash
cv
Córnico
kw
Corso
co
Cree
cr
Creek
mus
Tártaro da Crimeia (latim)
crh
Croata
hr
Crow
cro
Tcheco
cs
Dinamarquês
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
doi
Duala
dua
Dungan
dng
Holandês
nl
Efik
efi
English
en
erzya (cirílico)
myv
Estoniano
et
Faroês
fo
Fijiano
fj
Filipino
fil
Finlandês
fi
Idioma
Código (opcional)
Fon
fon
Francês
fr
Friuliano
fur
Ga
gaa
gagauz (latino)
gag
Galego
gl
Ganda
lg
Gayo
gay
Alemão
de
Gilbertês
gil
Gondi (Devanagari)
gon
Grego
el
Groenlandês
kl
Guarani
gn
Gurung (Devanagari)
gvr
Gusii
guz
Crioulo haitiano
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
havaiano
haw
Hebraico
he
Herero
hz
Hiligaynon
hil
Híndi
hi
Hmong daw (latim)
mww
Ho(Devanagiri)
hoc
Húngaro
hu
Iban
iba
Islandês
é
Igbo
ig
Iloko
ilo
sami de Inari
smn
Indonésio
ID
Ingush
inh
Interlíngua
ia
Inuktitut (Latino)
iu
Irlandês
ga
Italiano
it
Japonês
ja
Jaunsari (Devanagari)
Jns
Javanês
jv
Jola-Fonyi
dyo
Kabardian
kbd
Kabuverdianu
kea
Kachin (latim)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karachay-Balkar
krc
kara-kalpak (cirílico)
kaa-cyrl
Caracalpaque (latino)
kaa
Cashubiano
csb
cazaque (cirílico)
kk-cyrl
cazaque (latino)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
Quiché
quc
Kikuyu
ki
Kildin Sami
sjd
Quiniaruanda
rw
Komi
kv
Kongo
kg
Coreano
ko
Korku
kfq
koryak
kpy
kosraean
kos
Kpelle
kpe
Kuanyama
kj
kumyk (cirílico)
kum
Curdo (árabe)
ku-arab
Curdo (latino)
ku-latn
Kurukh (Devanagari)
kru
quirguiz (cirílico)
ky
Lak
lbe
Lakota
lkt
Idioma
Código (opcional)
Latim
la
Letão
lv
Lezghian
lex
Lingala
ln
Lituano
lt
baixo sorábio
dsb
Lozi
loz
sami de Lule
smj
Luo (Quênia e Tanzânia)
luo
Luxemburguês
lb
Luyia
luy
Macedônio
mk
Machame
jmc
Madurese
mad
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malgaxe
mg
Malaio (latino)
ms
Maltês
mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
min
Mapudungun
arn
Marati
mr
Mari (Rússia)
chm
Masai
mas
Mende (Serra Leoa)
homens
Meru
mer
Meta'
mgo
Minangkabau
min
Mohawk
moh
Mongol (Cirílico)
mn
Mongondow
mog
montenegrino (cirílico)
cnr-cyrl
montenegrino (latino)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
Não
Navajo
nv
Ndonga
ng
Napolitano
nap
Nepali
ne
Ngomba
jgo
niueano
niu
nogay
nog
Ndebele do Norte
nd
sami setentrional (latino)
sme
Norueguês
não
Nianja
ny
Nyankole
nyn
Nzima
nzi
Occitânico
oc
Ojibwa
oj
Oromo
om
osseto
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Persa
fa
Polonês
pl
Português
pt
Punjabi (Árabe)
pa
Quíchua
qu
ripuário
ksh
Romeno
ro
Romanche
rm
Rundi
rn
Russo
ru
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
samoano (latino)
sm
Sango
sg
Idioma
Código (opcional)
Sangu (Gabão)
snq
Sanskrit (Devanagari)
sa
Santali(Devanagiri)
sat
Escocês
sco
Gaélico escocês
gd
Sena
seh
Sérvio (cirílico)
sr-cyrl
Sérvio (latino)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Devanagari)
srx
sami de Skolt
sms
Eslovaco
sk
Esloveno
sl
Soga
xog
Somali (árabe)
SO
Somali (latino)
so-latn
Songhai
son
Ndebele do Sul
nr
Altai do Sul
alt
sami do sul
sma
Sotho do Sul
st
Espanhol
es
Sundanês
su
Suaíli (latim)
sw
Swati
ss
Sueco
sv
Tabassaran
tab
Tachelhit
shi
Taitiano
ty
Taita
dav
Tadjique (Cirílico)
tg
Tâmil
ta
Tatar (cirílico)
tt-cyrl
Tártaro (latim)
tt
Teso
teo
Tetum
tet
Tailandês
th
Thani
thf
Tok Pisin
tpi
Tongan
até
Tsonga
ts
Tswana
tn
Turco
tr
turcomeno (latino)
tk
Tuva
tyv
Udmurt
udm
Uighur (cirílico)
ug-cyrl
Ucraniano
uk
Alto sorábio
hsb
Urdu
ur
Uigur (árabe)
ug
Usbeque (árabe)
uz-arab
Uzbeque (cirílico)
uz-cyrl
Uzbeque (latino)
uz
Vietnamita
vi
Volapuque
vo
Vunjo
vun
Walser
wae
Galês
cy
Frísio ocidental
fy
Wolof
wo
Xhosa
xh
Yucatec Maya
yua
Zapoteca
zap
Zarma
dje
Zuangue
za
Zulu
zu
A tabela a seguir lista os idiomas com suporte para extração de textos manuscritos.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it