Suporte a idiomas: modelos personalizados
Artigo 12/12/2024
1 contribuidor
Comentários
Neste artigo
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (GA)
Os modelos do Azure AI Document Intelligence fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de documentos estruturados, semiestruturados e não estruturados específicos para seus casos de uso. Modelos personalizados independentes podem ser combinados para criar modelos compostos. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:
Classificador personalizado
Idioma—Código de localidade
Predefinido
Inglês (Estados Unidos)—en-US
Inglês (Estados Unidos)—en-US
Idioma
Código (opcional)
Afrikaans
af
Albanês
sq
Árabe
ar
Búlgaro
bg
Chinês (Han (variante simplificada))
zh-Hans
Chinês (Han (variante tradicional))
zh-Hant
Croata
hr
Checo
cs
Dinamarquês
da
Neerlandês
nl
Estónio
et
Finlandês
fi
Francês
fr
Alemão
de
Hebraico
he
Hindi
hi
Húngaro
hu
Indonésio
id
Italiano
it
Japonês
ja
Coreano
ko
Letão
lv
Lituano
lt
Macedónio
mk
Marata
mr
Grego moderno (1453-)
el
Nepalês (macrolinguagem)
ne
Norueguês
no
Panjabi
pa
Persa
fa
Polaco
pl
Português
pt
Romeno
rm
Russo
ru
Eslovaco
sk
Esloveno
sl
Somali (árabe)
so
Somali (Latim)
so-latn
Espanhol
es
Swahili (macrolinguagem)
sw
Sueco
sv
Tâmil
ta
Tailandês
th
Turco
tr
Ucraniano
uk
Urdu
ur
Vietnamita
vi
Neural personalizado
A tabela a seguir lista os idiomas suportados para texto impresso.
Idioma
Código (opcional)
Afrikaans
af
Albanês
sq
Árabe
ar
Búlgaro
bg
Chineses (Simplificado)
zh-Hans
Chinês (Tradicional)
zh-Hant
Croata
hr
Checo
cs
Dinamarquês
da
Neerlandês
nl
Português
en
Estónio
et
Finlandês
fi
Francês
fr
Alemão
de
Hebraico
he
Hindi
hi
Húngaro
hu
Indonésio
id
Italiano
it
Japonês
ja
Coreano
ko
Letão
lv
Lituano
lt
Macedónio
mk
Marata
mr
Grego moderno (1453-)
el
Nepalês (macrolinguagem)
ne
Norueguês
no
Panjabi
pa
Persa
fa
Polaco
pl
Português
pt
Romeno
rm
Russo
ru
Eslovaco
sk
Esloveno
sl
Somali (árabe)
so
Somali (Latim)
so-latn
Espanhol
es
Swahili (macrolinguagem)
sw
Sueco
sv
Tâmil
ta
Tailandês
th
Turco
tr
Ucraniano
uk
Urdu
ur
Vietnamita
vi
A tabela a seguir lista os idiomas suportados para extrair textos manuscritos .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Modelo personalizado
A tabela a seguir lista os idiomas suportados para texto impresso .
Idioma
Código (opcional)
Abaza
ABQ
Abcásia
ab
Chinês
ás
Acoli
ach
Adangme
Ada
Adyghe
Ady
Afar
AA
Afrikaans
AF
Akan
AK
Albanês
sq
Algonquin
ALQ
Angika (Devanagari)
ANP
Árabe
ar
Asturiano
AST
Asu (Tanzânia)
ASA
Avaric
AV
Awadhi-Hindi (Devanagari)
AWA
Aymara
ay
Azerbaijão (Latim)
AZ
Máfia
KSF
Bagheli
Bfy
Bambara
BM
Basquir
ba
Basco
eu
Bielorrusso (cirílico)
ser, be-cyrl
Bielorrusso (Latim)
be, be-latn
Bemba (Zâmbia)
bem
Bena (Tanzânia)
bez
Bhojpuri-Hindi (Devanagari)
BHO
Bikol
Bik
Bini
classe
Bislama
bi
Bodo (Devanagari)
BRX
Bósnio (Latim)
BS
Brajbha
Sutiã
Bretão
br
Búlgaro
bg
Bundeli
BNS
Buryat (cirílico)
Bua
Catalão
ca
Cebuano
CEB
Chamling
Rab
Chamorro
ch
Checheno
ce
Chhattisgarhi (Devanagari)
HNE
Chiga
CGG
Chineses (Simplificado)
zh-Hans
Chinês (Tradicional)
zh-Hant
Choctaw
Cho
Chukot
CKT
Chuvash
CV
Cornualha
kW
Córsega
co
Cree
CR
Riacho
Mus
Tártaro da Crimeia (latim)
CRH
Croata
h
Corvo
Cro
Checo
cs
Dinamarquês
da
Dargwa
dar
Dari
PRS
Dhimal (Devanagari)
DHI
Dogri (Devanagari)
doi
Duala
Dua
Dungan
GND
Neerlandês
nl
Efik
EFI
Português
in
Erzya (cirílico)
MYV
Estónio
et
Faroense
fo
Fijiano
FJ
Filipino
fil
Finlandês
fi
Idioma
Código (opcional)
Fon
Fon
Francês
fr
Friuliano
peles
Ga
GAA
Gagauz (latim)
Mordaça
Galego
gl
Ganda
LG
Gayo
gay
Alemão
al
Gilbertese
Gil
Gondi (Devanagari)
vai
Grego
el
Gronelândia
KL
Guarani
GN
Gurung (Devanagari)
GVR
Gusii
Guz
Crioulo haitiano
HT
Halbi (Devanagari)
HLB
Hani
hni
Haryanvi
BGC
Havaiano
Haw
Hebraico
he
Herero
HZ
Hiligaynon
Hil
Hindi
hi
Hmong Daw (Latim)
MWW
Ho(Devanagiri)
HOC
Húngaro
hu
Iban
IBA
Islandês
é
Igbo
IG
Iloko
OIT
Inari Sami
SMN
Indonésio
id
Inguche
INH
Interlíngua
ia
Inuktitut (latim)
IU
Irlandês
GA
Italiano
it
Japonês
ja
Jaunsari (Devanagari)
Jns
Javanês
JV
Jola-Fonyi
Dyo
Kabardiano
KBD
Kabuverdianu
Kea
Kachin (Latim)
Kac
Kalenjin
KLN
Kalmyk
xal
Kangri (Devanagari)
XNR
Kanuri
KR
Karachay-Balkar
KRC
Kara-Kalpak (cirílico)
Kaa-Cyrl
Kara-Kalpak (Latim)
Kaa
Kashubian
CSB
Cazaque (cirílico)
kk-cyrl
Cazaque (Latim)
kk-latn
Khakas
KJH
Khaling
KLR
Khasi
Kha
K'iche»
Quc
Kikuyu
ki
Kildin Sami
SJD
Kinyarwanda
RW
Komi
kv
Kongo
kg
Coreano
ko
Korku
KFQ
Koryak
KPY
Kosraean
Kós
Kpelle
kpe
Kuanyama
KJ
Kumyk (cirílico)
Kum
Curdo (árabe)
Ku-Árabe
Curdo (latim)
Ku-Latn
Kurukh (Devanagari)
Kru
Quirguistão (cirílico)
KY
Lak
LBE
Lakota
LKT
Idioma
Código (opcional)
Latim
la
Letão
lv
Lezghian
Lex
Lingala
ln
Lituano
lt
Baixo Sorbian
DSB
Lozi
loz
Lule Sami
SMJ
Luo (Quênia e Tanzânia)
luo
Luxemburguês
lb
Luyia
Luy
Macedónio
Mk
Machame
JMC
Madurese
louco
Mahasu Pahari (Devanagari)
BFZ
Makhuwa-Meetto
MGH
Makonde
KDE
Malgaxe
em mg
Malaio (Latim)
ms
Maltês
mt
Malto (Devanagari)
KMJ
Mandinka
MNK
Manx
GV
Maori
mi
Mapudungun
ARN
Marata
O Sr.
Mari (Rússia)
CHM
Masai
mas
Mende (Serra Leoa)
homens
Meru
Mer
Meta»
MGO
Minangkabau
min
Mohawk
Moh
Mongol (cirílico)
MN
Mongondow
mog
Montenegrino (cirílico)
CNR-CYRL
Montenegrino (Latim)
CNR-LATN
Morisyen
MFE
Mundang
mua
Nahuatl
Não
Navajo
NV
Ndonga
ng
Napolitano
Sesta
Nepalês
ne
Ngomba
JGO
Niuean
NIU
Nogay
Nog
Ndebele do Norte
nd
Sami do Norte (Latim)
PME
Norueguês
não
Nyanja
Nova Iorque
Nyankole
Nova Iorque
Nzima
NZI
Occitano
OC
Ojibwa
JO
Oromo
om
Ossético
o
Pampanga
Pam
Pangasinan
pag
Papiamento
Papanicolau
Pashto
PS
Pedi
NSO
Persa
FA
Polaco
pl
Português
pt
Punjabi (árabe)
PA
Quechua
Qu
Ripuariano
KSH
Romeno
ro
Romanche
RM
Rundi
RN
Russo
ru
Rwa
RWK
Sadri (Devanagari)
Sck
Sakha
SAH
Samburu
SAQ
Samoa (Latim)
SM
Sango
SG
Idioma
Código (opcional)
Sangu (Gabão)
SNQ
Sânscrito (Devanagari)
SA
Santali(Devanagiri)
Sáb
Escoceses
sco
Gaélico escocês
GD
Sena
ela
Sérvio (Cirílico)
SR-CYRL
Sérvio (Latim)
Sr, Sr-Latn
Shambala
KSB
Shona
sn
Siksika
BLA
Sirmauri (Devanagari)
SRX
Skolt Sami
sms
Eslovaco
sk
Esloveno
sl
Soga
XOG
Somali (árabe)
so
Somali (Latim)
So-Latn
Songhai
filho
Ndebele do Sul
Nr
Altai do Sul
Alt
Sami Meridional
SMA
Sotho do Sul
st
Espanhol
es
Sundanês
SU
Swahili (latim)
sw
Suazilândia
ss
Sueco
sv
Tabassaran
guia
Tachelhit
Shi
Taitiano
ty
Taita
DAV
Tajique (cirílico)
TG
Tâmil
ta
Tártaro (cirílico)
TT-CYRL
Tártaro (Latim)
TT
Teso
Téo
Tétum
Tet
Tailandês
th
Thangmi
thf
Tok Pisin
TPI
Tonga
para
Tsonga
TS
Tswana
tn
Turco
tr
Turquemeno (latim)
TK
Tuvan
TYV
Udmurt
UDM
Uigur (cirílico)
ug-cyrl
Ucraniano
uk
Alto Sorábio
HSB
Urdu
o seu
Uigur (árabe)
ug
Uzbeque (árabe)
UZ-Árabe
Usbeque (Cirílico)
UZ-CYRL
Uzbeque (Latim)
UZ
Vietnamita
vi
Volapük
VO
Vunjo
VUN
Walser
Wae
Galês
cy
Frísio Ocidental
fy
Wolof
wo
Xhosa
xh
Iucatego
Yua
Zapoteca
zap
Zarma
Dje
Zhuang
za
Zulu
zu
A tabela a seguir lista os idiomas suportados para extrair textos manuscritos.
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it