Prise en charge linguistique : modèles personnalisés
Article 12/13/2024
1 contributeur
Commentaires
Dans cet article
Ce contenu s’applique à : v2.1 | Dernière version : v4.0 (GA)
Les modèles d’Intelligence documentaire d’Azure AI fournissent une prise en charge multilingue du traitement des documents. Nos fonctionnalités de prise en charge linguistique permettent à vos utilisateurs de communiquer avec vos applications de manière naturelle et renforcent leur portée mondiale. Des modèles personnalisés sont formés à l'aide de vos ensembles de données étiquetés pour extraire des données distinctes à partir de documents structurés, semi-structurés et non structurés, en fonction de vos cas d'utilisation. Ces modèles personnalisés autonomes peuvent être combinés pour créer des modèles composés. Les tableaux suivants répertorient la prise en charge des langues et des paramètres régionaux disponibles par modèle et fonctionnalité :
Classifieur personnalisé
Langue : code de paramètres régionaux
Default
Anglais (États-Unis) : en-US
Anglais (États-Unis) : en-US
Langage
Code (facultatif)
Afrikaans
af
Albanais
sq
Arabe
ar
Bulgare
bg
Chinois (Han (variante simplifiée))
zh-Hans
Chinois (Han (variante traditionnelle))
zh-Hant
Croate
hr
Tchèque
cs
Danois
da
Néerlandais
nl
Estonien
et
Finnois
fi
Français
fr
Allemand
de
Hébreu
he
Hindi
hi
Hongrois
hu
Indonésien
id
Italien
it
Japonais
ja
Coréen
ko
Letton
lv
Lituanien
lt
Macédonien
mk
Marathi
mr
Grec moderne (1453-)
el
Népalais (macrolangue)
ne
Norvégien
no
Panjabi
pa
Persan
fa
Polonais
pl
Portugais
pt
Roumain
rm
Russe
ru
Slovaque
sk
Slovène
sl
Somali (arabe)
so
Somalien (latin)
so-latn
Espagnol
es
Swahili (macrolangue)
sw
Suédois
sv
Tamoul
ta
Thaï
th
Turc
tr
Ukrainien
uk
Ourdou
ur
Vietnamien
vi
Neural personnalisé
Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.
Langage
Code (facultatif)
Afrikaans
af
Albanais
sq
Arabe
ar
Bulgare
bg
Chinois (simplifié)
zh-Hans
Chinois (traditionnel)
zh-Hant
Croate
hr
Tchèque
cs
Danois
da
Néerlandais
nl
Anglais
en
Estonien
et
Finnois
fi
Français
fr
Allemand
de
Hébreu
he
Hindi
hi
Hongrois
hu
Indonésien
id
Italien
it
Japonais
ja
Coréen
ko
Letton
lv
Lituanien
lt
Macédonien
mk
Marathi
mr
Grec moderne (1453-)
el
Népalais (macrolangue)
ne
Norvégien
no
Panjabi
pa
Persan
fa
Polonais
pl
Portugais
pt
Roumain
rm
Russe
ru
Slovaque
sk
Slovène
sl
Somali (arabe)
so
Somalien (latin)
so-latn
Espagnol
es
Swahili (macrolangue)
sw
Suédois
sv
Tamoul
ta
Thaï
th
Turc
tr
Ukrainien
uk
Ourdou
ur
Vietnamien
vi
Le tableau suivant répertorie les langues prises en charge pour l'extraction de textes manuscrits .
Langage
Code langue (facultatif)
Langage
Code langue (facultatif)
Anglais
en
Japonais
ja
Chinois (simplifié)
zh-Hans
Coréen
ko
Français
fr
Portugais
pt
Allemand
de
Espagnol
es
Italien
it
Modèle personnalisé
Le tableau suivant répertorie les langues prises en charge pour le texte imprimé.
Langage
Code (facultatif)
Abaza
abq
Abkhaze
ab
Aceh
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Afar
aa
Afrikaans
af
Akan
ak
Albanais
sq
Algonquin
alq
Angika (Devanagari)
anp
Arabe
ar
Asturien
ast
Asu (Tanzanie)
asa
Avaric
av
Awadhi-Hindi (Devanagari)
awa
Aymara
ay
Azerbaïdjanais (Latin)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Bashkir
ba
Basque
eu
Biélorusse (cyrillique)
be, be-cyrl
Biélorusse (latin)
be, be-latn
Bemba (Zambie)
bem
Bena (Tanzanie)
bez
Bhojpuri-Hindi (devanagari)
bho
Bikol
bik
Bini
bin
Bichelamar
bi
Bodo (devanagari)
brx
Bosniaque (latin)
bs
Brajbha
bra
Breton
br
Bulgare
bg
Bundeli
bns
Buryat (cyrillique)
bua
Catalan
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Tchétchène
ce
Chhattisgarhi (devanagari)
hne
Chiga
cgg
Chinois (simplifié)
zh-Hans
Chinois traditionnel
zh-Hant
Choctaw
cho
Chukot
ckt
Tchouvache
cv
Cornique
kw
Corse
co
Cris
cr
Creek
mus
Tatar de Crimée (latin)
crh
Croate
hr
Crow
cro
Tchèque
cs
Danois
da
Dargwa
dar
Dari
prs
Dhimal (devanagari)
dhi
Dogri (devanagari)
doi
Duala
dua
Dungan
dng
Néerlandais
nl
Efik
efi
English
en
Erzya (Cyrillique)
myv
Estonien
et
Féroïen
fo
Fidjien
fj
Filipino
fil
Finnois
fi
Langage
Code (facultatif)
Fon
fon
Français
fr
Frioulan
fur
Ga
gaa
Gagauz (Latin)
gag
Galicien
gl
Ganda
lg
Gayo
gay
Allemand
de
Gilbertin
gil
Gondi (devanagari)
gon
Grec
el
Groenlandais
kl
Guarani
gn
Gurung (devanagari)
gvr
Gusii
guz
Créole haïtien
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
Hawaïen
haw
Hébreu
he
Herero
hz
Hiligaynon
hil
Hindi
hi
Hmong daw (latin)
mww
Ho (devanagari)
hoc
Hongrois
hu
Iban
iba
Islandais
is
Igbo
ig
Iloko
ilo
Inari Sami
smn
Indonésien
id
Ingush
inh
Interlingua
ia
Inuktitut (Latin)
iu
Irlandais
ga
Italien
it
Japonais
ja
Jaunsari (Devanagari)
Jns
Javanais
jv
Jola-Fonyi
dyo
Kabarde
kbd
Créole du Cap-Vert
kea
Kachin (latin)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karachay-Balkar
krc
Kara-Kalpak (Cyrillique)
kaa-cyrl
Kara-Kalpak (Latin)
kaa
Cachoube
csb
Kazakh (Cyrillique)
kk-cyrl
Kazakh (Latin)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
Quiché
quc
Kikuyu
ki
Kildin Sami
sjd
Kinyarwanda
rw
Komi
kv
Kongo
kg
Coréen
ko
Korku
kfq
Koryak
kpy
Kosrae
kos
Kpelle
kpe
Kuanyama
kj
Kumyk (Cyrillique)
kum
Kurde (arabe)
ku-arab
Kurde (latin)
ku-latn
Kurukh (devanagari)
kru
Kirghiz (cyrillique)
ky
Lak
lbe
Lakota
lkt
Langage
Code (facultatif)
Latin
la
Letton
lv
Lezghien
lex
Lingala
ln
Lituanien
lt
Bas sorabe
dsb
Lozi
loz
Lule Sami
smj
Luo (Kenya et Tanzanie)
luo
Luxembourgeois
lb
Luyia
luy
Macédonien
mk
Machame
jmc
Madurais
mad
Mahasu Pahari (devanagari)
bfz
Makhuwa-Meetto
mgh
Makondé
kde
Malgache
mg
Malais (latin)
ms
Maltais
mt
Malto (devanagari)
kmj
Mandinka
mnk
Mannois
gv
Maori
mi
Mapuche
arn
Marathi
mr
Mari (Russie)
chm
Masai
mas
Mende (Sierra Leone)
hommes
Meru
mer
Meta’
mgo
Minangkabau
min
Mohawk
moh
Mongole (cyrillique)
mn
Mongondow
mog
Monténégrin (cyrillique)
cnr-cyrl
Montenegrin (latin)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitain
nap
Népalais
ne
Ngomba
jgo
Niué
niu
Nogay
nog
Ndebele nord
nd
Same du Nord (latin)
sme
Norvégien
non
Nyanja
ny
Nyankole
nyn
Nzima
nzi
Occitan
oc
Ojibwa
oj
Oromo
om
Ossète
SE
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pachto
ps
Pedi
nso
Persan
fa
Polonais
pl
Portugais
pt
Pendjabi (arabe)
pa
Quechua
qu
Francique ripuaire
ksh
Roumain
ro
Romanche
rm
Rundi
rn
Russe
ru
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
Samoan (latin)
sm
Sango
sg
Langage
Code (facultatif)
Sangu (Gabon)
snq
Sanskrit (devanagari)
SA
Santali (devanagari)
Sam
Scots
sco
Gaélique écossais
gd
Sena
seh
Serbe (cyrillique)
sr-cyrl
Serbe (latin)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (devanagari)
srx
Same de Skolt
sms
Slovaque
sk
Slovène
sl
Soga
xog
Somali (arabe)
SO
Somalien (latin)
so-latn
Songhaï
son
Ndebele sud
nr
Altai sud
alt
Same du Sud
sma
Sotho sud
st
Espagnol
es
Soundanais
su
Swahili (latin)
sw
Swati
ss
Suédois
sv
Tabassaran
tab
Tachelhit
shi
Tahitien
ty
Taita
dav
Tadjik (cyrillique)
tg
Tamoul
ta
Tatar (cyrillique)
tt-cyrl
Tatar (latin)
tt
Teso
teo
Tétoum
tet
Thaï
th
Thangmi
thf
Tok Pisin
tpi
Tonga
à
Tsonga
ts
Tswana
tn
Turc
tr
Turkmène (latin)
tk
Touvain
tyv
Udmurt
udm
Ouïghour (cyrillique)
ug-cyrl
Ukrainien
uk
Haut sorabe
hsb
Ourdou
ur
Ouïgour (arabe)
ug
Ouzbek (arabe)
uz-arab
Ouzbek (cyrillique)
uz-cyrl
Ouzbek (latin)
uz
Vietnamien
vi
Volapük
vo
Vunjo
vun
Haut-valaisan
wae
Gallois
cy
Frison occidental
fy
Wolof
wo
Xhosa
xh
Yucatec Maya
yua
Zapotèque
zap
Zarma
dje
Zhuang
za
Zoulou
zu
Le tableau suivant répertorie les langues prises en charge pour l'extraction de textes manuscrits.
Langage
Code langue (facultatif)
Langage
Code langue (facultatif)
Anglais
en
Japonais
ja
Chinois (simplifié)
zh-Hans
Coréen
ko
Français
fr
Portugais
pt
Allemand
de
Espagnol
es
Italien
it