Podpora jazyků: vlastní modely
Článek 11/19/2024
1 přispěvatel
Váš názor
V tomto článku
Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (GA)
Modely Azure AI Document Intelligence poskytují podporu vícejazyčného zpracování dokumentů. Naše možnosti podpory jazyka umožňují uživatelům komunikovat s vašimi aplikacemi přirozenými způsoby a umožnit globální outreach. Vlastní modely se trénují pomocí označených datových sad k extrakci odlišných dat ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů specifických pro vaše případy použití. Samostatné vlastní modely je možné kombinovat a vytvářet složené modely. Následující tabulky uvádějí dostupnou podporu jazyka a národního prostředí podle modelu a funkce:
Vlastní klasifikátor
Jazyk – kód národního prostředí
Výchozí
Angličtina (USA) – cs-CZ
Angličtina (USA) – cs-CZ
Jazyk
Kód (volitelné)
Afrikánština
af
Albánština
sq
Arabština
ar
Bulharština
bg
Čínština (Han (zjednodušená varianta))
zh-Hans
Čínština (Han (tradiční varianta))
zh-Hant
Chorvatština
hr
Čeština
cs
Dánština
da
Nizozemština
nl
Estonština
et
Finština
fi
Francouzština
fr
Němčina
de
Hebrejština
he
Hindština
hi
Maďarština
hu
Indonéština
id
Italština
it
japonština
ja
Korejština
ko
Lotyština
lv
Litevština
lt
Makedonština
mk
Maráthština
mr
Moderní řečtina (1453-)
el
Nepálština (makrolanguage)
ne
Norština
no
Paňdžábština
pa
Perština
fa
Polština
pl
Portugalština (Brazílie)
pt
Rumunština
rm
Ruština
ru
Slovenština
sk
Slovinština
sl
Somali (arabština)
so
Somali (latinka)
so-latn
Španělština
es
Swahili (makrolanguage)
sw
Švédština
sv
Tamilština
ta
Thajština
th
Turečtina
tr
Ukrajinština
uk
Urdština
ur
Vietnamština
vi
Vlastní neurální
Následující tabulka uvádí podporované jazyky pro tištěný text.
Jazyk
Kód (volitelné)
Afrikánština
af
Albánština
sq
Arabština
ar
Bulharština
bg
Čínština (zjednodušená)
zh-Hans
Čínština (tradiční)
zh-Hant
Chorvatština
hr
Čeština
cs
Dánština
da
Nizozemština
nl
Angličtina
en
Estonština
et
Finština
fi
Francouzština
fr
Němčina
de
Hebrejština
he
Hindština
hi
Maďarština
hu
Indonéština
id
Italština
it
japonština
ja
Korejština
ko
Lotyština
lv
Litevština
lt
Makedonština
mk
Maráthština
mr
Moderní řečtina (1453-)
el
Nepálština (makrolanguage)
ne
Norština
no
Paňdžábština
pa
Perština
fa
Polština
pl
Portugalština (Brazílie)
pt
Rumunština
rm
Ruština
ru
Slovenština
sk
Slovinština
sl
Somali (arabština)
so
Somali (latinka)
so-latn
Španělština
es
Swahili (makrolanguage)
sw
Švédština
sv
Tamilština
ta
Thajština
th
Turečtina
tr
Ukrajinština
uk
Urdština
ur
Vietnamština
vi
Následující tabulka uvádí podporované jazyky pro extrakci rukou psaných textů.
Jazyk
Kód jazyka (volitelné)
Jazyk
Kód jazyka (volitelné)
Angličtina
en
Japonština
ja
Čínština (zjednodušená)
zh-Hans
Korejština
ko
Francouzština
fr
Portugalština
pt
Němčina
de
Španělština
es
Italština
it
Vlastní šablona
Následující tabulka uvádí podporované jazyky pro tištěný text.
Jazyk
Kód (volitelné)
Abaza
abq
Abcházský
ab
Achinese
eso
Acoli
ach
Adangme
Ada
Adyghe
Ady
Afarsko
aa
Afrikánština
af
Akan
Ak
Albánština
sq
Algonquin
alq
Angika (Devanagari)
anp
Arabština
ar
Asturština
Ast
Asu (Tanzanie)
Asa
Avaric
Av
Awadhi-Hindština (Devanagari)
Awa
Aymara
ano
Ázerbájdžánština (latinka)
Az
Bafia
ksf
Bagheli
bfy
Bambara
Bm
Baškirština
ba
Baskičtina
eu
Běloruský (cyrilice)
be, be-cyrl
Běloruský (latinka)
be, be-latn
Bemba (Zambia)
Bem
Bena (Tanzanie)
bez
Bhojpurština-Hindština (Devanagari)
bho
Bikol
Bik
Bini
bin
Bislama
bisexuální
Bodo (Devanagari)
brx
Bosenština (latinka)
Bs
Brajbha
podprsenka
Bretonština
Br
Bulharština
bg
Bundeli
Bns
Buryat (cyrilice)
bua
Katalánština
ca
Cebuano
ceb
Zkosení
Rab
Chamorro
ch
Čečenský
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Čínština (zjednodušená)
zh-Hans
Čínština (tradiční)
zh-Hant
Choctaw
Cho
Čukotský autonomní okruh
ckt
Chuvash
CV
Cornwallština
kW
Korsičtina
co
Krí
Čr
Potok
mus
Krymský Tatar (latinka)
crh
Chorvatština
hod.
Vrána
Cro
Čeština
cs
Dánština
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
Doi
Duala
Dua
Dungan
dng
Nizozemština
nl
Efik
Efi
Angličtina
en
Erzya (cyrilice)
myv
Estonština
et
Faerština
fo
Fidžijština
fj
Filipino
Fil
Finština
fi
Jazyk
Kód (volitelné)
Fon
Fon
Francouzština
fr
Friulian
kožešina
Ga
Gaa
Gagauz (latinka)
roubík
Galicijština
gl
Ganda
Lg
Gayo
gay
Němčina
de
Gilbertese
Gil
Gondi (Devanagari)
Gon
Řečtina
el
Grónština
Kl
Guaranština
Gn
Gurung (Devanagari)
gvr
Gusii
guz
Haitská kreolština
Ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
Havajský
plod hlohu
Hebrejština
he
Herero
Hz
Hiligaynon
hil
Hindština
hi
Hmong Daw (latinka)
mww
Ho(Devanagiri)
Hoc
Maďarština
hu
Iban
Iba
Islandština
is
Igbo
Ig
Iloko
Mezinárodní organizace práce
Inari Sami
smn
Indonéština
ID
Ingush
Inh
Interlingua
Ia
Inuktitut (latinka)
Iu
Irština
Ghanština
Italština
to
japonština
ja
Jaunsari (Devanagari)
Jns
Jávský
joint venture
Jola-Fonyi
dyo
Kabardian
kbd
Kabuverdianu
Kea
Kachin (latinka)
Kac
Kalenjin
Kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
Kr
Karachay-Balkar
krc
Kara-Kalpak (cyrilice)
kaa-cyrl
Kara-Kalpak (latinka)
Kaa
Kašubština
Csb
Kazaština (cyrilice)
kk-cyrl
Kazaština (latinka)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
Kha
K'iche'
quc
Kikuyu
Ki
Kildin Sami
Sjd
Kinyarwanda
Rw
Komi
kv
Kongo
Kg
Korejština
ko
Korku
kfq
Koryak
kpy
Kosraean
Kos
Kpelle
kpe
Kuanyama
Kj
Kumyk (cyrilice)
Kum
Arabština (arabština)
ku-arab
Amerika (latinka)
ku-latn
Kurukh (Devanagari)
kru
Kyrgyz (cyrilice)
Ky
Lak
Lbe
Lakota
lkt
Jazyk
Kód (volitelné)
Latina
la
Lotyština
lv
Lezghian
zákon
Lingala
ln
Litevština
lt
Dolnolužičtina
dsb
Lozi
Loz
Lule Sami
smj
Luo (Keňa a Tanzanie)
Luo
Lucemburština
Lb
Luyia
Luy
Makedonština
mk
Machame
jmc
Madurese
šílený
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
Mgh
Makonde
kde
Malgaština
Mg
Malajá (latinka)
sl.
Maltština
mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manština
Gv
Maorština
míle
Mapudungun
Arn
Maráthština
pan
Mari (Rusko)
Chm
Masai
Mas
Mende (Sierra Leone)
muži
Meru
Mer
Meta'
mgo
Minangkabau
min
Číro
Moh
Mongolština (cyrilice)
Mn
Mongondow
Mog
Montenegrin (cyrilice)
cnr-cyrl
Montenegrin (latinka)
cnr-latn
Morisyen
mfe
Mundang
Mua
Nahuatl
Ne
Navajo
nv
Ndonga
Ng
Neapolské
zdřímnutí
Nepálština
ne
Ngomba
jgo
Niuean
Niu
Nogay
dřevěný kolík
North Ndebele
nd
Severní Sami (latinka)
Msp
Norština
ne
Nyanja
Ny
Nyankole
nyn
Nzima
nzi
Okcitánština
Oc
Ojibwa
oj
Oromo
Ze
Ossetic
operační systém
Pampanga
Pam
Pangasinan
Pag
Papiamento
kaše
Pashto
PS
Pedi
Nso
Perština
fa
Polština
pl
Portugalština
pt
Pašábština (arabština)
taťka
Quechua
Qu
Ripuarian
ksh
Rumunština
ro
Románština
mikrometr
Rundi
Rn
Ruština
ru
Rwa
rwk
Sadri (Devanagari)
sck
Sacha (Jakutsko)
Sah
Samburu
saq
Samoan (latinka)
sm
Sango
Sg
Jazyk
Kód (volitelné)
Sangu (Gabon)
snq
Sanskrit (Devanagari)
přidružení zabezpečení
Santali(Devanagiri)
seděl
Skotové
sco
Skotská gaelština
Gd
Sena
ona
Srbština (cyrilice)
sr-cyrl
Srbština (latinka)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
Bla
Sirmauri (Devanagari)
srx
Skolt Sami
sms
Slovenština
sk
Slovinština
sl
Soga
xog
Somali (arabština)
so
Somali (latinka)
so-latn
Songhai
son (syn)
South Ndebele
Nr
Jižní Altai
Alt
Jižní Sami
Sma
Jižní Sotho
sv
Španělština
es
Sundánština
Su
Swahili (latinka)
sw
Swati
ss
Švédština
sv
Tabassaran
tabulátor
Tachelhit
Shi
Tahitština
ty
Taita
Dav
Tádžik (cyrilice)
Tg
Tamilština
ta
Tatar (cyrilice)
tt-cyrl
Tatar (latinka)
TT
Teso
teo
Tetum
Tet
Thajština
th
Thangmi
thf
Tok Pisin
Tpi
Tongánština
na
Tsonga
Ts
Čwanština
tn
Turečtina
tr
Turkmen (latinka)
Tk
Tuvan
tyv
Udmurt
udm
Uighur (cyrilice)
ug-cyrl
Ukrajinština
uk
Hornolužická srbština
Hsb
Urdština
ur
Yghur (arabština)
Ug
Uzbečtina (arabština)
uz-arab
Uzbečtina (cyrilice)
uz-cyrl
Uzbečtina (latinka)
uz
Vietnamština
vi
Volapük
Vo
Vunjo
vun
Walser
Wae
Velština
Cy
Západní Frisian
Fy
Wolof
pr
Xhoština
xh
Yucatécká mayština
Yua
Zapotec
odprásknout
Zarma
dje
Zhuang
za
Zulština
zu
Následující tabulka uvádí podporované jazyky pro extrakci rukou psaných textů.
Jazyk
Kód jazyka (volitelné)
Jazyk
Kód jazyka (volitelné)
Angličtina
en
Japonština
ja
Čínština (zjednodušená)
zh-Hans
Korejština
ko
Francouzština
fr
Portugalština
pt
Němčina
de
Španělština
es
Italština
it