Модели аналитики документов Azure обеспечивают поддержку многоязычной обработки документов. Возможности поддержки языка позволяют пользователям взаимодействовать с вашими приложениями естественными способами и обеспечивать глобальную пропаганду. Модели анализа документов позволяют извлекать текст из форм и документов и возвращать структурированное содержимое, готовое для бизнеса, готовое к действиям, использованию или ходу выполнения вашей организации. В следующих таблицах перечислены доступные языковые стандарты и поддержка по модели и функции:
Чтение: модель чтения позволяет извлекать и анализировать печатный и рукописный текст. Эта модель является базовым механизмом OCR для других предварительно созданных моделей аналитики документов, таких как макет, общий документ, счет, квитанция, удостоверение (идентификатор), карточка медицинского страхования, налоговые документы и пользовательские модели. Дополнительные сведения см. в разделе "Общие сведения о модели чтения"
Макет. Модель макета позволяет извлекать и анализировать текст, таблицы, структуру документов и метки выделения (например, переключатели и флажки) из форм и документов.
Общий документ: общая модель документов позволяет извлекать и анализировать пары текста, структуры документов и пар "ключ-значение". Дополнительные сведения см. в разделе"Общие сведения о модели документов"
Примечание.
Код языка (необязательно)
Универсальные модели глубокого обучения аналитики документов извлекают все многоязычные тексты в документах, включая текстовые строки с смешанными языками, и не требуют указания языкового кода.
Не предоставляйте языковой код в качестве параметра, если вы не уверены в языке и хотите принудительно применить службу только соответствующую модель. В противном случае служба может вернуть неполный и неправильный текст.
Кроме того, не обязательно указывать языковой стандарт. Этот параметр является необязательным. Технология глубокого обучения аналитики документов автоматически обнаруживает текстовый язык на изображении.
В следующей таблице перечислены поддержку языка модели чтения для извлечения и анализа печатного текста.
Язык
Код (необязательно)
Абазинский
abq
Абхазский
ab
Ачинский
ace
Аколи
ach
Adangme
ada
Адыгейский
ady
Афар
aa
Африкаанс
af
Акан
ak
Албанский
sq
Алгонкин
alq
Ангика (Деванагари)
anp
Арабский
ar
Астурийский
ast
Асу (Танзания)
asa
Аварич
av
Авадхи хинди (Деванагари)
awa
Аймара
ay
Азербайджанская (латиница)
az
Бафия
ksf
Багхели
bfy
Бамбара
bm
Башкирский
ba
Баскский (Баскский)
eu
Белорусский (кириллица)
be, be-cyrl
Белорусский (латиница)
be, be-latn
Бемба (Замбия)
bem
Бена (Танзания)
bez
Бходжпури хинди (Деванагари)
bho
Бикольский
bik
Бини
bin
Бислама
bi
Бодо (Деванагари)
brx
Боснийский (латиница)
bs
Браджбха
bra
Бретонский
br
Болгарский
bg
Бундели
bns
Бурятский (кириллица)
bua
Каталанский
ca
Cebuano
ceb
Чамлинг
rab
Чаморро
ch
Чеченский
ce
Чхаттисгархи (Деванагари)
hne
Чига
cgg
китайский (упрощенный)
zh-Hans
китайский (традиционный)
zh-Hant
Чоктав
cho
Чукотка
ckt
Чувашский
cv
Корнский
kw
Корсиканский
co
Кри
cr
Ручей
mus
Крымско-татарский (латиница)
crh
Хорватский
hr
Ворона
cro
чешский
cs
датский
da
Даргва
dar
Дари
prs
Дхималь (Деванагари)
dhi
Догри (Деванагари)
doi
Дуала
dua
Дунганский
dng
Голландский
nl
Эфик
efi
Английский
en
Ерзянский (кириллица)
myv
Эстонский
et
Фарерский
fo
Фиджийский
fj
Филиппинский
fil
Финский
fi
Язык
Код (необязательно)
Fon
fon
Французский
fr
Фриульский
fur
Ga
gaa
Гагаузский (латиница)
gag
Галисийский
gl
Ганда
lg
Гейо
gay
Немецкий
de
Кирибати
gil
Гонди (Деванагари)
gon
Греческий
el
Гренландский
kl
Гуарани
gn
Гурунг (Деванагари)
gvr
Gusii
guz
Гаитянский креольский
ht
Халби (Деванагари)
hlb
Хани
hni
Харьянви
bgc
Гавайская
haw
Иврит
he
Гереро
hz
Хилигайнон
hil
Хинди
hi
Хмонг дау (латиница)
mww
Хо (Деванагири)
hoc
Венгерский
hu
Iban
iba
Исландский
is
Игбо
ig
Илоко
ilo
Инари-саамский
smn
Индонезийский
id
Ингушский
inh
Интерлингва
ia
Inuktitut (латиница)
iu
Ирландский
ga
Итальянский
it
Японский
ja
Яунсари (Деванагари)
Jns
Яванский
jv
Jola-Fonyi
dyo
Кабардино-черкесский
kbd
Кабувердьяну
kea
Качинский (латиница)
kac
Kalenjin
kln
Калмыцкий
xal
Кангри (Деванагари)
xnr
Канури
kr
Карачаево-балкарский
krc
Каракалпакский (кириллица)
kaa-cyrl
Каракалпакский (латиница)
kaa
Кашубский
csb
Казахский (кириллица)
kk-cyrl
Казахский (латиница)
kk-latn
Хакасский
kjh
Халинг
klr
Кхаси
kha
K'iche'
quc
Кикуйю
ki
Килдин Сами
sjd
Киньяруанда
rw
Коми
kv
Конго
kg
Корейский
ko
Корку
kfq
Корякский
kpy
Косяэ
kos
Kpelle
kpe
Kuanyama
kj
Кумыкский (кириллица)
kum
Курдский (арабский)
ku-arab
Курдский (латиница)
ku-latn
Курух (Деванагири)
kru
Киргизский (кириллица)
ky
Lak
lbe
Лакота
lkt
Язык
Код (необязательно)
Латинская
la
Латышский
lv
Лезгиан
lex
Лингала
ln
Литовский
lt
Нижнелужицкий
dsb
Лози
loz
Луле-саамский
smj
Луо (Кения и Танзания)
luo
Люксембургский
lb
Луия
luy
Macedonian
mk
Machame
jmc
Мадурезе
mad
Махасу пахари (Деванагари)
bfz
Макхува-Встреча
mgh
Маконде
kde
Малагасийский
mg
Малайский (латиница)
ms
Мальтийский
mt
Малто (Деванагари)
kmj
Мандинка
mnk
Мэнский
gv
Маори
mi
Mapudungun
arn
Маратхи
mr
Мари (Россия)
chm
Масаи
mas
Менде (Сьерра-Леоне)
men
Меру
mer
Мета'
mgo
Минангкабау
min
Индеец-могавк
moh
Монгольский (кириллица)
mn
Mongondow
mog
Черногорский (кириллица)
cnr-cyrl
Черногорский (латиница)
cnr-latn
Морисен
mfe
Манданг
mua
Науатль
nah
Навахо
nv
Ndonga
ng
Неаполитанский
nap
Непальский
ne
Нгомба
jgo
Ниуэ
niu
Ногайский
nog
Северная Ндебеле
nd
Северносаамский (латиница)
sme
Норвежский
no
Ньянджа
ny
Nyankole
nyn
Nzima
nzi
Окситанский
oc
Ojibwa
oj
Оромо
om
Осетинский
os
Пампанга
pam
Пангасинан
pag
Папьяменто
pap
Пушту
ps
Педи
nso
Персидский
fa
Польский
pl
Португальский
pt
Пенджаби (арабский)
pa
Кечуа
qu
Рипуарский
ksh
Румынский
ro
Ретороманский
rm
Рунди
rn
русский
ru
Rwa
rwk
Садри (Деванагари)
sck
Саха
sah
Самбуру
saq
Самоанский (латиница)
sm
Санго
sg
Язык
Код (необязательно)
Сангу (Габон)
snq
Санскрит (Деванагари)
sa
Сантали (Деванагири)
sat
Шотландский
sco
Гэльский
gd
Сена
seh
Сербский (кириллица)
sr-cyrl
Сербский (латиница)
sr, sr-latn
Шамбала
ksb
Шона
sn
Siksika
bla
Сирмаури (Деванагари)
srx
Колтта-саамский
sms
Словацкий
sk
Словенский
sl
Сога
xog
Сомали (арабское письмо)
so
Сомалийский (латиница)
so-latn
Сонхай
son
Южная Ндебеле
nr
Южный Алтайский
alt
Южносаамский
sma
Сесото
st
Испанский
es
Sundanese
su
Суахили (латиница)
sw
Свати
ss
Шведский
sv
Табассаран
tab
Тачелхит
shi
Таитянский
ty
Тайта
dav
Таджикский (кириллица)
tg
Тамильский
ta
Татарский (кириллица)
tt-cyrl
Татарский (латиница)
tt
Teso
teo
Тетум
tet
Тайский
th
Тхангми
thf
Ток-писин
tpi
Тонганский
to
Тсонга
ts
Тсвана
tn
Турецкий
tr
Туркменский (латиница)
tk
Тувинский
tyv
Удмуртский
udm
Уйгур (кириллица)
ug-cyrl
Украинский
uk
Верхнелужицкий
hsb
Урду
ur
Уйгурский (арабское письмо)
ug
Узбекский (арабское письмо)
uz-arab
Узбекский (кириллица)
uz-cyrl
Узбекский (латиница)
uz
Вьетнамский
vi
Волапюк
vo
Vunjo
vun
Валлисский
wae
Валлийский
cy
Западнофризский
fy
Волоф
wo
Коса
xh
Юкатекский майя
yua
Запотек
zap
Зарма
dje
Чжуанский
za
Зулусский
zu
В следующей таблице перечислены поддержку языка модели чтения для извлечения и анализа печатного текста.
Язык
Код (необязательно)
Африкаанс
af
Ангика
anp
Арабский
ar
Астурийский
ast
Авадхи
awa
Азербайджанский
az
Белорусский (кириллица)
be, be-cyrl
Белорусский (латиница)
be-latn
Багхели
bfy
Махасу Пахари
bfz
Болгарский
bg
Харьянви
bgc
Бходжпури
bho
Бислама
bi
Бундели
bns
Бретонский
br
Брэй
bra
Бодо
brx
Боснийский
bs
Буриат
bua
Каталанский
ca
Cebuano
ceb
Чаморро
ch
Черногорский (латиница)
cnr, cnr-latn
Черногорский (кириллица)
cnr-cyrl
Корсиканский
co
Крымскотатарский
crh
чешский
cs
Кашубский
csb
Валлийский
cy
Датский
da
Немецкий
de
Dhimal
dhi
Догри
doi
Нижнелужицкий
dsb
Английский
en
Испанский
es
Эстонский
et
Баскский
eu
Персидский
fa
Финский
fi
Филиппинский
fil
Язык
Код (необязательно)
Фиджи
fj
Фарерский
fo
Французский
fr
Фриульский
fur
Западнофризский
fy
Ирландский
ga
Гагаузский
gag
Гэльский
gd
Кирибати
gil
Галисийский
gl
Гонди
gon
Мэнский
gv
Гурунг
gvr
Гавайская
haw
Хинди
hi
Halbi
hlb
Чхаттисгархи
hne
Хани
hni
Ho
hoc
Хорватский
hr
Верхнелужицкий
hsb
Гаитянский
ht
Венгерский
hu
Интерлингва
ia
Индонезийский
id
Исландский
is
Итальянский
it
Инуктитут
iu
Японский
Jaunsari
jns
Яванский
jv
Каракалпакский (латиница)
kaa, kaa-latn
Каракалпакский (кириллица)
kaa-cyrl
Качин
kac
Кабувердьяну
kea
Корку
kfq
Кхаси
kha
Казахский (латиница)
kk, kk-latn
Казахский (кириллица)
kk-cyrl
Калааллисут
kl
Халинг
klr
Malto
kmj
Язык
Код (необязательно)
Корейский
Косяэ
kos
Корякский
kpy
Карачаево-балкарский
krc
Курух
kru
Kölsch
ksh
Курдский (латиница)
ku, ku-latn
Курдский (арабский)
ku-arab
Кумыкский
kum
Корнский
kw
Киргизский
ky
Латинская
la
Люксембургский
lb
Лакота
lkt
Литовский
lt
Маори
mi
Монгольский
mn
Маратхи
mr
Малайский
ms
Мальтийский
mt
Хмонг Daw
mww
Эрзянский
myv
Неаполитанский
nap
Непальский
ne
Ниуэ
niu
Голландский
nl
Норвежский
no
Ногайский
nog
Окситанский
oc
Осетинский
os
Панджаби
pa
Польский
pl
Дари
prs
Pushto
ps
Португальский
pt
K'iche'
quc
Камлинг
rab
Ретороманский
rm
Румынский
ro
Русский
ru
Санскрит
sa
Сантали
sat
Язык
Код (необязательно)
Садри
sck
Шотландский
sco
Словацкий
sk
Словенский
sl
Самоанский
sm
Южносаамский
sma
Северная Сами
sme
Луле-саамский
smj
Инари-саамский
smn
Колтта-саамский
sms
Сомалийский
so
Албанский
sq
Сербский (латиница)
sr, sr-latn
Сирмаури
srx
Шведский
sv
Суахили
sw
Тетум
tet
Таджикский
tg
Тхангми
thf
Туркменский
tk
Тонга
to
Турецкий
tr
Татарский
tt
Тувинский
tyv
Уйгурский
ug
Урду
ur
Узбекский (латиница)
uz, uz-latn
Узбекский (кириллица)
uz-cyrl
Узбекский (арабское письмо)
uz-arab
Волапюк
vo
Валлисский
wae
Кангри
xnr
Yucateco
yua
Чжуанский
za
Китайский (Хан (упрощенный вариант))
zh, zh-hans
Китайский (Хан (традиционный вариант))
zh-hant
Зулусский
zu
В следующей таблице перечислены поддержку языка модели чтения для извлечения и анализа рукописного текста.
Язык
Код языка (необязательно)
Язык
Код языка (необязательно)
Английский
en
Японский
ja
китайский (упрощенный)
zh-Hans
Корейский
ko
Французский
fr
Португальский
pt
немецкий
de
Испанский
es
Итальянский
it
Русский (предварительная версия)
ru
Тайский (предварительная версия)
th
Арабский (предварительная версия)
ar
В следующей таблице перечислены поддержку языка модели чтения для извлечения и анализа рукописного текста.
Язык
Код языка (необязательно)
Язык
Код языка (необязательно)
Английский
en
Японский
ja
китайский (упрощенный)
zh-Hans
Корейский
ko
Французский
fr
Португальский
pt
немецкий
de
Испанский
es
Итальянский
it
В следующей таблице перечислены поддержку языка модели чтения для извлечения и анализа рукописного текста.
Язык
Код языка (необязательно)
Язык
Код языка (необязательно)
Английский
en
Японский
ja
китайский (упрощенный)
zh-Hans
Корейский
ko
Французский
fr
Португальский
pt
немецкий
de
Испанский
es
Итальянский
it
API модели чтения поддерживает обнаружение языка для следующих языков в документах. Этот список может включать языки, которые в настоящее время не поддерживаются для извлечения текста.
Внимание
Распознавание языка
Модель чтения документов может обнаруживать наличие языков и возвращать коды языка для обнаруженных языков.
Обнаруженные языки и извлеченные языки
В этом разделе перечислены языки, которые можно обнаружить в документах с помощью модели чтения (при наличии).
Обратите внимание, что этот список отличается от списка языков, для которых поддерживается извлечение текста (такие языки приведены в разделах выше для каждой модели).
Язык
Код
Африкаанс
af
Албанский
sq
Амхарский
am
Арабский
ar
Армянский
hy
Ассамский
as
Азербайджанский
az
Баскский (Баскский)
eu
Белорусский
be
Бенгальский
bn
Боснийский
bs
Болгарский
bg
Бирманский
my
Каталанский
ca
Центральный кхмерский
km
Китайский
zh
китайский (упрощенный)
zh_chs
китайский (традиционный)
zh_cht
Корсиканский
co
Хорватский
hr
Чешский
cs
Датский
da
Дари
prs
Дивихай
dv
Голландский
nl
Английский
en
Esperanto
eo
Эстонский
et
Фиджийский
fj
Финский
fi
французский
fr
Галисийский
gl
Грузинский
ka
немецкий
de
Греческий
el
Гуджарати
gu
Гаитянский
ht
Хауса
ha
Иврит
he
Hindi
hi
Хмонг дау
mww
Венгерский
hu
Исландский
is
Игбо
ig
Индонезийский
id
Инуктитут
iu
Ирландский
ga
Итальянский
it
Японский
ja
Яванский
jv
Каннада
kn
Казахский
kk
Киньяруанда
rw
Киргизский
ky
Корейский
ko
Курдский
ku
Лаосский
lo
Латинская
la
Язык
Код
Латышский
lv
Литовский
lt
Люксембургский
lb
Macedonian
mk
Малагасийский
mg
Малайский
ms
Малаялам
ml
Мальтийский
mt
Маори
mi
Маратхи
mr
Монгольский
mn
Непальский
ne
Норвежский
no
Норвежский (нюнорск)
nn
Ория
or
Пушту
ps
Персидский
fa
Польский
pl
Португальский
pt
Панджаби
pa
Керетарский диалект отоми
otq
Румынский
ro
Русский
ru
Самоанский
sm
Сербский
sr
Шона
sn
Синдхи
sd
Сингальский
si
Словацкий
sk
Словенский
sl
Сомалийский
so
Испанский
es
Sundanese
su
Суахили
sw
Шведский
sv
Тагальский
tl
Таитянский
ty
Таджикский
tg
Тамильский
ta
Татарский
tt
Телугу
te
Тайский
th
Тибетский
bo
Тигринья
ti
Тонганский
to
Турецкий
tr
Туркменский
tk
Украинский
uk
Урду
ur
Узбекский
uz
Вьетнамский
vi
Валлийский
cy
Коса
xh
Идиш
yi
Йоруба
yo
Юкатекский майя
yua
Зулусский
zu
Макет
Идентификатор модели: предварительно созданный макет
В следующей таблице перечислены поддерживаемые языки для печатного текста:
Язык
Код (необязательно)
Абазинский
abq
Абхазский
ab
Ачинский
ace
Аколи
ach
Adangme
ada
Адыгейский
ady
Афар
aa
Африкаанс
af
Акан
ak
Албанский
sq
Алгонкин
alq
Ангика (Деванагари)
anp
Арабский
ar
Астурийский
ast
Асу (Танзания)
asa
Аварич
av
Авадхи хинди (Деванагари)
awa
Аймара
ay
Азербайджанская (латиница)
az
Бафия
ksf
Багхели
bfy
Бамбара
bm
Башкирский
ba
Баскский (Баскский)
eu
Белорусский (кириллица)
be, be-cyrl
Белорусский (латиница)
be, be-latn
Бемба (Замбия)
bem
Бена (Танзания)
bez
Бходжпури хинди (Деванагари)
bho
Бикольский
bik
Бини
bin
Бислама
bi
Бодо (Деванагари)
brx
Боснийский (латиница)
bs
Браджбха
bra
Бретонский
br
Болгарский
bg
Бундели
bns
Бурятский (кириллица)
bua
Каталанский
ca
Cebuano
ceb
Чамлинг
rab
Чаморро
ch
Чеченский
ce
Чхаттисгархи (Деванагари)
hne
Чига
cgg
китайский (упрощенный)
zh-Hans
китайский (традиционный)
zh-Hant
Чоктав
cho
Чукотка
ckt
Чувашский
cv
Корнский
kw
Корсиканский
co
Кри
cr
Ручей
mus
Крымско-татарский (латиница)
crh
Хорватский
hr
Ворона
cro
чешский
cs
датский
da
Даргва
dar
Дари
prs
Дхималь (Деванагари)
dhi
Догри (Деванагари)
doi
Дуала
dua
Дунганский
dng
Голландский
nl
Эфик
efi
Английский
en
Ерзянский (кириллица)
myv
Эстонский
et
Фарерский
fo
Фиджийский
fj
Филиппинский
fil
Финский
fi
Язык
Код (необязательно)
Fon
fon
Французский
fr
Фриульский
fur
Ga
gaa
Гагаузский (латиница)
gag
Галисийский
gl
Ганда
lg
Гейо
gay
Немецкий
de
Кирибати
gil
Гонди (Деванагари)
gon
Греческий
el
Гренландский
kl
Гуарани
gn
Гурунг (Деванагари)
gvr
Gusii
guz
Гаитянский креольский
ht
Халби (Деванагари)
hlb
Хани
hni
Харьянви
bgc
Гавайская
haw
Иврит
he
Гереро
hz
Хилигайнон
hil
Хинди
hi
Хмонг дау (латиница)
mww
Хо (Деванагири)
hoc
Венгерский
hu
Iban
iba
Исландский
is
Игбо
ig
Илоко
ilo
Инари-саамский
smn
Индонезийский
id
Ингушский
inh
Интерлингва
ia
Inuktitut (латиница)
iu
Ирландский
ga
Итальянский
it
Японский
ja
Яунсари (Деванагари)
Jns
Яванский
jv
Jola-Fonyi
dyo
Кабардино-черкесский
kbd
Кабувердьяну
kea
Качинский (латиница)
kac
Kalenjin
kln
Калмыцкий
xal
Кангри (Деванагари)
xnr
Канури
kr
Карачаево-балкарский
krc
Каракалпакский (кириллица)
kaa-cyrl
Каракалпакский (латиница)
kaa
Кашубский
csb
Казахский (кириллица)
kk-cyrl
Казахский (латиница)
kk-latn
Хакасский
kjh
Халинг
klr
Кхаси
kha
K'iche'
quc
Кикуйю
ki
Килдин Сами
sjd
Киньяруанда
rw
Коми
kv
Конго
kg
Корейский
ko
Корку
kfq
Корякский
kpy
Косяэ
kos
Kpelle
kpe
Kuanyama
kj
Кумыкский (кириллица)
kum
Курдский (арабский)
ku-arab
Курдский (латиница)
ku-latn
Язык
Код (необязательно)
Курух (Деванагири)
kru
Киргизский (кириллица)
ky
Lak
lbe
Лакота
lkt
Латинская
la
Латышский
lv
Лезгиан
lex
Лингала
ln
Литовский
lt
Нижнелужицкий
dsb
Лози
loz
Луле-саамский
smj
Луо (Кения и Танзания)
luo
Люксембургский
lb
Луия
luy
Macedonian
mk
Machame
jmc
Мадурезе
mad
Махасу пахари (Деванагари)
bfz
Макхува-Встреча
mgh
Маконде
kde
Малагасийский
mg
Малайский (латиница)
ms
Мальтийский
mt
Малто (Деванагари)
kmj
Мандинка
mnk
Мэнский
gv
Маори
mi
Mapudungun
arn
Маратхи
mr
Мари (Россия)
chm
Масаи
mas
Менде (Сьерра-Леоне)
men
Меру
mer
Мета'
mgo
Минангкабау
min
Индеец-могавк
moh
Монгольский (кириллица)
mn
Mongondow
mog
Черногорский (кириллица)
cnr-cyrl
Черногорский (латиница)
cnr-latn
Морисен
mfe
Манданг
mua
Науатль
nah
Навахо
nv
Ndonga
ng
Неаполитанский
nap
Непальский
ne
Нгомба
jgo
Ниуэ
niu
Ногайский
nog
Северная Ндебеле
nd
Северносаамский (латиница)
sme
Норвежский
no
Ньянджа
ny
Nyankole
nyn
Nzima
nzi
Окситанский
oc
Ojibwa
oj
Оромо
om
Осетинский
os
Пампанга
pam
Пангасинан
pag
Папьяменто
pap
Пушту
ps
Педи
nso
Персидский
fa
Польский
pl
Португальский
pt
Пенджаби (арабский)
pa
Кечуа
qu
Рипуарский
ksh
Румынский
ro
Ретороманский
rm
Рунди
rn
русский
ru
Язык
Код (необязательно)
Rwa
rwk
Садри (Деванагари)
sck
Саха
sah
Самбуру
saq
Самоанский (латиница)
sm
Санго
sg
Сангу (Габон)
snq
Санскрит (Деванагари)
sa
Сантали (Деванагири)
sat
Шотландский
sco
Гэльский
gd
Сена
seh
Сербский (кириллица)
sr-cyrl
Сербский (латиница)
sr, sr-latn
Шамбала
ksb
Шона
sn
Siksika
bla
Сирмаури (Деванагари)
srx
Колтта-саамский
sms
Словацкий
sk
Словенский
sl
Сога
xog
Сомали (арабское письмо)
so
Сомалийский (латиница)
so-latn
Сонхай
son
Южная Ндебеле
nr
Южный Алтайский
alt
Южносаамский
sma
Сесото
st
Испанский
es
Sundanese
su
Суахили (латиница)
sw
Свати
ss
Шведский
sv
Табассаран
tab
Тачелхит
shi
Таитянский
ty
Тайта
dav
Таджикский (кириллица)
tg
Тамильский
ta
Татарский (кириллица)
tt-cyrl
Татарский (латиница)
tt
Teso
teo
Тетум
tet
Тайский
th
Тхангми
thf
Ток-писин
tpi
Тонганский
to
Тсонга
ts
Тсвана
tn
Турецкий
tr
Туркменский (латиница)
tk
Тувинский
tyv
Удмуртский
udm
Уйгур (кириллица)
ug-cyrl
Украинский
uk
Верхнелужицкий
hsb
Урду
ur
Уйгурский (арабское письмо)
ug
Узбекский (арабское письмо)
uz-arab
Узбекский (кириллица)
uz-cyrl
Узбекский (латиница)
uz
Вьетнамский
vi
Волапюк
vo
Vunjo
vun
Валлисский
wae
Валлийский
cy
Западнофризский
fy
Волоф
wo
Коса
xh
Юкатекский майя
yua
Запотек
zap
Зарма
dje
Чжуанский
za
Зулусский
zu
В следующей таблице приведена поддержка языка модели макета для извлечения и анализа печатного текста.
Язык
Код (необязательно)
Африкаанс
af
Ангика
anp
Арабский
ar
Астурийский
ast
Авадхи
awa
Азербайджанский
az
Белорусский (кириллица)
be, be-cyrl
Белорусский (латиница)
be-latn
Багхели
bfy
Махасу Пахари
bfz
Болгарский
bg
Харьянви
bgc
Бходжпури
bho
Бислама
bi
Бундели
bns
Бретонский
br
Брэй
bra
Бодо
brx
Боснийский
bs
Буриат
bua
Каталанский
ca
Cebuano
ceb
Чаморро
ch
Черногорский (латиница)
cnr, cnr-latn
Черногорский (кириллица)
cnr-cyrl
Корсиканский
co
Крымскотатарский
crh
чешский
cs
Кашубский
csb
Валлийский
cy
Датский
da
Немецкий
de
Dhimal
dhi
Догри
doi
Нижнелужицкий
dsb
Английский
en
Испанский
es
Эстонский
et
Баскский
eu
Персидский
fa
Финский
fi
Филиппинский
fil
Язык
Код (необязательно)
Фиджи
fj
Фарерский
fo
Французский
fr
Фриульский
fur
Западнофризский
fy
Ирландский
ga
Гагаузский
gag
Гэльский
gd
Кирибати
gil
Галисийский
gl
Гонди
gon
Мэнский
gv
Гурунг
gvr
Гавайская
haw
Хинди
hi
Halbi
hlb
Чхаттисгархи
hne
Хани
hni
Ho
hoc
Хорватский
hr
Верхнелужицкий
hsb
Гаитянский
ht
Венгерский
hu
Интерлингва
ia
Индонезийский
id
Исландский
is
Итальянский
it
Инуктитут
iu
Японский
Jaunsari
jns
Яванский
jv
Каракалпакский (латиница)
kaa, kaa-latn
Каракалпакский (кириллица)
kaa-cyrl
Качин
kac
Кабувердьяну
kea
Корку
kfq
Кхаси
kha
Казахский (латиница)
kk, kk-latn
Казахский (кириллица)
kk-cyrl
Калааллисут
kl
Халинг
klr
Malto
kmj
Язык
Код (необязательно)
Корейский
Косяэ
kos
Корякский
kpy
Карачаево-балкарский
krc
Курух
kru
Kölsch
ksh
Курдский (латиница)
ku, ku-latn
Курдский (арабский)
ku-arab
Кумыкский
kum
Корнский
kw
Киргизский
ky
Латинская
la
Люксембургский
lb
Лакота
lkt
Литовский
lt
Маори
mi
Монгольский
mn
Маратхи
mr
Малайский
ms
Мальтийский
mt
Хмонг Daw
mww
Эрзянский
myv
Неаполитанский
nap
Непальский
ne
Ниуэ
niu
Голландский
nl
Норвежский
no
Ногайский
nog
Окситанский
oc
Осетинский
os
Панджаби
pa
Польский
pl
Дари
prs
Pushto
ps
Португальский
pt
K'iche'
quc
Камлинг
rab
Ретороманский
rm
Румынский
ro
Русский
ru
Санскрит
sa
Сантали
sat
Язык
Код (необязательно)
Садри
sck
Шотландский
sco
Словацкий
sk
Словенский
sl
Самоанский
sm
Южносаамский
sma
Северная Сами
sme
Луле-саамский
smj
Инари-саамский
smn
Колтта-саамский
sms
Сомалийский
so
Албанский
sq
Сербский (латиница)
sr, sr-latn
Сирмаури
srx
Шведский
sv
Суахили
sw
Тетум
tet
Таджикский
tg
Тхангми
thf
Туркменский
tk
Тонга
to
Турецкий
tr
Татарский
tt
Тувинский
tyv
Уйгурский
ug
Урду
ur
Узбекский (латиница)
uz, uz-latn
Узбекский (кириллица)
uz-cyrl
Узбекский (арабское письмо)
uz-arab
Волапюк
vo
Валлисский
wae
Кангри
xnr
Yucateco
yua
Чжуанский
za
Китайский (Хан (упрощенный вариант))
zh, zh-hans
Китайский (Хан (традиционный вариант))
zh-hant
Зулусский
zu
Язык
Код языка
Африкаанс
af
Албанский
sq
Астурийский
ast
Баскский (Баскский)
eu
Бислама
bi
Бретонский
br
Каталанский
ca
Cebuano
ceb
Чаморро
ch
Китайский (упрощенное письмо)
zh-Hans
Китайский (традиционное письмо)
zh-Hant
Корнский
kw
Корсиканский
co
Крымско-татарский (латиница)
crh
чешский
cs
датский
da
Голландский
nl
Английский (печатный и рукописный)
en
Эстонский
et
Фиджийский
fj
Филиппинский
fil
Финский
fi
французский
fr
Фриульский
fur
Галисийский
gl
Немецкий
de
Кирибати
gil
Гренландский
kl
Гаитянский креольский
ht
Хани
hni
Хмонг дау (латиница)
mww
Венгерский
hu
Индонезийский
id
Интерлингва
ia
Inuktitut (латиница)
iu
Ирландский
ga
Язык
Код языка
Итальянский
it
Японский
ja
Яванский
jv
K'iche'
quc
Кабувердьяну
kea
Качинский (латиница)
kac
Каракалпаки
kaa
Кашубский
csb
Кхаси
kha
Корейский
ko
Курдский (латиница)
kur
Люксембургский
lb
Малайский (латиница)
ms
Мэнский
gv
Неаполитанский
nap
Норвежский
no
Окситанский
oc
Польский
pl
Португальский
pt
Ретороманский
rm
Шотландский
sco
Гэльский
gd
Словенский
slv
Испанский
es
Суахили (латиница)
sw
Шведский
sv
Татарский (латиница)
tat
Тетум
tet
Турецкий
tr
Верхнелужицкий
hsb
Узбекский (латиница)
uz
Волапюк
vo
Валлисский
wae
Западнофризский
fy
Юкатекский майя
yua
Чжуанский
za
Зулусский
zu
В следующей таблице приведена поддержка языка модели макета для извлечения и анализа рукописного текста.
Язык
Код языка (необязательно)
Язык
Код языка (необязательно)
Английский
en
Японский
ja
китайский (упрощенный)
zh-Hans
Корейский
ko
Французский
fr
Португальский
pt
немецкий
de
Испанский
es
Итальянский
it
Русский (предварительная версия)
ru
Тайский (предварительная версия)
th
Арабский (предварительная версия)
ar
Идентификатор модели: предварительно созданный макет
В следующей таблице приведена поддержка языка модели макета для извлечения и анализа рукописного текста.
Язык
Код языка (необязательно)
Язык
Код языка (необязательно)
Английский
en
Японский
ja
китайский (упрощенный)
zh-Hans
Корейский
ko
Французский
fr
Португальский
pt
немецкий
de
Испанский
es
Итальянский
it
Примечание.
Аналитика документов версии 2.1 не поддерживает извлечение рукописного текста.
В следующей таблице приведена поддержка языка модели макета для извлечения и анализа рукописного текста.
Язык
Код языка (необязательно)
Язык
Код языка (необязательно)
Английский
en
Японский
ja
китайский (упрощенный)
zh-Hans
Корейский
ko
Французский
fr
Португальский
pt
немецкий
de
Испанский
es
Итальянский
it
Русский (предварительная версия)
ru
Тайский (предварительная версия)
th
Арабский (предварительная версия)
ar
Документ общего назначения
Внимание
С помощью Аналитики документов версии 4.0:2024-07-31-preview, 2023-10-31-preview и идет вперед, общая модель документов (предварительно созданный документ) добавляется в макет (предварительно созданный макет). Чтобы извлечь пары "ключ-значение", метки выделения, текст, таблицы и структура из документов, используйте следующие модели:
Пары "ключ — значение"
версия
Model ID
Модель макета с указанной строкой features=keyValuePairs запроса.