Azure AI Document Intelligence モデルは、多言語ドキュメント処理のサポートを提供します。 Microsoft の言語サポート機能を使用すると、ユーザーは自然な方法でアプリケーションと通信し、グローバル展開を強化できます。 ドキュメント分析モデルを使用して、フォームやドキュメントからテキストを抽出し、組織のアクション、運用、進捗などに利用できる、構造化されたビジネス対応コンテンツを返すことができます。 次の表に、モデルと機能別に使用可能な言語とロケールのサポートを示します。
- 読み取り: 読み取りモデルを使用すると、印字されたテキストと手書きのテキストの抽出と分析が可能になります。 このモデルは、レイアウト、一般ドキュメント、請求書、領収書、身分証明書 (ID)、医療保険カード、税務書類、カスタム モデルなど、他の Document Intelligence 事前構築済みモデルの基になる OCR エンジンです。 詳細については、読み取りモデルの概要に関する記事を "参照 してください"
- レイアウト: レイアウト モデルを使用すると、フォームやドキュメントからテキスト、テーブル、ドキュメント構造、選択マーク (ラジオ ボタンやチェック ボックスなど) を抽出および分析できます。
Note
言語コード (省略可能)
Document Intelligence のディープ ラーニング ベースのユニバーサル モデルでは、言語が混在するテキスト行を含め、ドキュメント内のすべての多言語テキストが抽出され、言語コードを指定する必要はありません。
言語について確認し、関連するモデルのみサービスを適用するように強制する場合を除き、言語コードをパラメーターとして指定しないでください。 そうしないと、サービスが不完全で不正確なテキストを返すことがあります。
また、ロケールを指定する必要はありません。 これは省略可能なパラメーターです。 Document Intelligence のディープラーニング テクノロジによって、画像内のテキストの言語が自動的に検出されます。
読み取りモデル
モデル ID: prebuilt-read
次の表は、読み取りモデルによる印字テキストの抽出と分析でサポートされる言語を示しています。
言語 |
コード (省略可能) |
アバザ語 |
abq |
アブハズ語 |
ab |
アチェ語 |
ace |
アチョリ語 |
ach |
アダングメ語 |
ada |
アディゲ語 |
ady |
アファール語 |
aa |
アフリカーンス語 |
af |
アカン語 |
ak |
アルバニア語 |
sq |
アルゴンキン語 |
alq |
アンギカ語 (デーヴァナーガリー) |
anp |
アラビア語 |
ar |
アストリア語 |
ast |
アス語 (タンザニア) |
asa |
アバール語 |
av |
アワディー語 (デーヴァナーガリー) |
awa |
アイマラ語 |
ay |
アゼルバイジャン語 (ラテン) |
az |
バフィア語 |
ksf |
バゲーリー語 |
bfy |
バンバラ語 |
bm |
バシキール語 |
ba |
バスク語 |
eu |
ベラルーシ語 (キリル) |
be 、be-cyrl |
ベラルーシ語 (ラテン) |
be 、 be-latn |
ビンバ語 (ザンビア) |
bem |
ベナ語 (タンザニア) |
bez |
ボージュプリー語 (デーヴァナーガリー) |
bho |
ビコル語 |
bik |
ビニ語 |
bin |
ビスラマ語 |
bi |
ボド語 (デーヴァナーガリー) |
brx |
ボスニア語 (ラテン) |
bs |
ブラジュバー語 |
bra |
ブルトン語 |
br |
ブルガリア語 |
bg |
ブンデーリー語 |
bns |
ブリヤート語 (キリル) |
bua |
カタロニア語 |
ca |
セブアノ語 |
ceb |
チャムリング語 |
rab |
チャモロ語 |
ch |
チェチェン語 |
ce |
チャッティースガリー語 (デーヴァナーガリー) |
hne |
チガ語 |
cgg |
中国語 (簡体字) |
zh-Hans |
中国語繁体字 |
zh-Hant |
チョクトー語 |
cho |
チュクチ語 |
ckt |
チュワシュ語 |
cv |
コーンウォール語 |
kw |
コルシカ語 |
co |
クリー語 |
cr |
クリーク語 |
mus |
クリミア タタール語 (ラテン) |
crh |
クロアチア語 |
hr |
カラス |
cro |
チェコ語 |
cs |
デンマーク語 |
da |
ダルグワ語 |
dar |
ダリー語 |
prs |
ディマール語 (デーヴァナーガリー) |
dhi |
ドーグリー語 (デーヴァナーガリー) |
doi |
ドゥアラ語 |
dua |
ドンガン語 |
dng |
オランダ語 |
nl |
エフィク語 |
efi |
English |
en |
エルジャ語 (キリル) |
myv |
エストニア語 |
et |
フェロー語 |
fo |
フィジー語 |
fj |
フィリピン語 |
fil |
フィンランド語 |
fi |
Language |
コード (省略可能) |
Fon |
fon |
フランス語 |
fr |
フリウリ語 |
fur |
Ga |
gaa |
ガガウズ語 (ラテン) |
gag |
ガリシア語 |
gl |
ガンダ語 |
lg |
ガヨ語 |
gay |
ドイツ語 |
de |
キリバス語 |
gil |
ゴーンディー語 (デーヴァナーガリー) |
gon |
ギリシャ語 |
el |
グリーンランド語 |
kl |
グアラニー語 |
gn |
グルン語 (デーヴァナーガリー) |
gvr |
グシイ語 |
guz |
ハイチ クレオール語 |
ht |
ハルビ語 (デーヴァナーガリー) |
hlb |
ハニ語 |
hni |
ハリヤーンウィー語 |
bgc |
ハワイ語 |
haw |
ヘブライ語 |
he |
ヘレロ語 |
hz |
ヒリガイノン語 |
hil |
ヒンディー語 |
hi |
ミャオ語 (ラテン) |
mww |
ホー語 (デーヴァナーガリー) |
hoc |
ハンガリー語 |
hu |
イバン語 |
iba |
アイスランド語 |
is |
イボ語 |
ig |
イロカノ語 |
ilo |
イナリ サーミ語 |
smn |
インドネシア語 |
id |
イングーシ語 |
inh |
インターリングア |
ia |
イヌクティトット語 (ラテン) |
iu |
アイルランド語 |
ga |
イタリア語 |
it |
日本語 |
ja |
ジャウンサーリー語 (デーヴァナーガリー) |
Jns |
ジャワ文字 |
jv |
ジョラ = フォニィ語 |
dyo |
カバルダ語 |
kbd |
カーボベルデ・クレオール語 |
kea |
カチン語 (ラテン) |
kac |
カレンジン語 |
kln |
カルムイク語 |
xal |
カーングリー語 (デーヴァナーガリー) |
xnr |
カヌリ語 |
kr |
カラチャイ バルカル語 |
krc |
カラ カルパク語 (キリル) |
kaa-cyrl |
カラ カルパク語 (ラテン) |
kaa |
カシュビア語 |
csb |
カザフ語 (キリル) |
kk-cyrl |
カザフ語 (ラテン) |
kk-latn |
ハカス語 |
kjh |
カリン語 |
klr |
カシ語 |
kha |
キチェ語 |
quc |
キクユ語 |
ki |
キルディン サーミ語 |
sjd |
キニヤルワンダ語 |
rw |
コミ語 |
kv |
コンゴ語 |
kg |
韓国語 |
ko |
コルク語 |
kfq |
コリャーク語 |
kpy |
コスラエ語 |
kos |
クペレ語 |
kpe |
クワニャマ語 |
kj |
クムク語 (キリル) |
kum |
クルド語 (アラビア文字) |
ku-arab |
クルド語 (ラテン文字) |
ku-latn |
クルク語 (デーヴァナーガリー) |
kru |
キルギス語 (キリル) |
ky |
Lak |
lbe |
ラコタ語 |
lkt |
Language |
コード (省略可能) |
ラテン語 |
la |
ラトビア語 |
lv |
レズギン語 |
lex |
リンガラ語 |
ln |
リトアニア語 |
lt |
低地ソルブ語 |
dsb |
ロジ語 |
loz |
ルレ サーミ語 |
smj |
ルオ語 (ケニアおよびタンザニア) |
luo |
ルクセンブルク語 |
lb |
ルヒヤ語 |
luy |
マケドニア語 |
mk |
マチャメ語 |
jmc |
マデュラ語 |
mad |
マハス パハリー語 (デーヴァナーガリー) |
bfz |
マクアミート語 |
mgh |
マコンデ語 |
kde |
マダガスカル語 |
mg |
マレー語 (ラテン) |
ms |
マルタ語 |
mt |
マルト語 (デーヴァナーガリー) |
kmj |
マンディンカ語 |
mnk |
マン語 |
gv |
マオリ語 |
mi |
マプチェ語 |
arn |
マラーティー語 |
mr |
マリ語 (ロシア) |
chm |
マサイ語 |
mas |
メンデ語 (シエラレオネ) |
men |
メル語 |
mer |
Meta' |
mgo |
ミナンカバウ語 |
min |
モホーク語 |
moh |
モンゴル語 (キリル) |
mn |
モンゴウドウ語 |
mog |
モンテネグロ語 (キリル) |
cnr-cyrl |
モンテネグロ語 (ラテン) |
cnr-latn |
モーリシャス語 |
mfe |
マンダン語 |
mua |
ナワトル語 |
nah |
ナバホ語 |
nv |
ンドンガ語 |
ng |
ナポリ語 |
nap |
ネパール語 |
ne |
ンゴンバ語 |
jgo |
ニウエ語 |
niu |
ノガイ語 |
nog |
北ンデベレ語 |
nd |
北部サーミ語 (ラテン) |
sme |
ノルウェー語 |
no |
ニャンジャ語 |
ny |
ニヤンコレ語 |
nyn |
ンゼマ語 |
nzi |
オクシタン語 |
oc |
オジブワ語 |
oj |
オロモ語 |
om |
オセット語 |
os |
パンパンガ語 |
pam |
パンガシナン語 |
pag |
パピアメント語 |
pap |
パシュトウ語 |
ps |
ペディ語 |
nso |
ペルシャ語 |
fa |
ポーランド語 |
pl |
(ブラジル) |
pt |
パンジャーブ語 (アラビア) |
pa |
ケチュア語 |
qu |
リプアーリ語 |
ksh |
ルーマニア語 |
ro |
ロマンシュ語 |
rm |
ランディ語 |
rn |
ロシア語 |
ru |
Rwa |
rwk |
サドリ語 (デーヴァナーガリー) |
sck |
サハ語 |
sah |
サンブル語 |
saq |
サモア語 (ラテン) |
sm |
サンゴ語 |
sg |
Language |
コード (省略可能) |
サング語 (ガボン) |
snq |
サンスクリット語 (デーヴァナーガリー) |
sa |
サンタル語 (デーヴァナーガリー) |
sat |
スコットランド語 |
sco |
スコットランド ゲール語 |
gd |
セナ語 |
seh |
セルビア語 (キリル) |
sr-cyrl |
セルビア語 (ラテン) |
sr 、sr-latn |
シャンバラ語 |
ksb |
ショナ語 |
sn |
ブラックフット語 |
bla |
スルマウリ語 (デーヴァナーガリー) |
srx |
スコルト サーミ語 |
sms |
スロバキア語 |
sk |
スロベニア語 |
sl |
ソガ語 |
xog |
ソマリ語 (アラビア語) |
so |
ソマリ語 (ラテン) |
so-latn |
ソンガイ語 |
son |
南ンデベル語 |
nr |
南アルタイ語 |
alt |
南部サーミ語 |
sma |
南ソト語 |
st |
スペイン語 |
es |
スンダ文字 |
su |
スワヒリ語 (ラテン) |
sw |
スワジ語 |
ss |
スウェーデン語 |
sv |
タバサラン語 |
tab |
タハディット語 |
shi |
タヒチ語 |
ty |
タイタ語 |
dav |
タジク語 (キリル) |
tg |
タミル語 |
ta |
タタール語 (キリル) |
tt-cyrl |
タタール語 (ラテン) |
tt |
テソ語 |
teo |
テトゥン語 |
tet |
タイ語 |
th |
タンミ語 |
thf |
トク ピシン語 |
tpi |
トンガ語 |
to |
ツォンガ語 |
ts |
ツワナ語 |
tn |
トルコ語 |
tr |
トルクメン語 (ラテン) |
tk |
トゥヴァ語 |
tyv |
ウドムルト語 |
udm |
ウイグル語 (キリル文字) |
ug-cyrl |
ウクライナ語 |
uk |
上ソルブ語 |
hsb |
ウルドゥ語 |
ur |
ウイグル語 (アラビア語) |
ug |
ウズベク語 (アラビア語) |
uz-arab |
ウズベク語 (キリル) |
uz-cyrl |
ウズベク語 (ラテン) |
uz |
ベトナム語 |
vi |
ヴォラピュク |
vo |
ブンホ語 |
vun |
ヴァリス語 |
wae |
ウェールズ語 |
cy |
西フリジア語 |
fy |
ウォロフ語 |
wo |
コサ語 |
xh |
ユカテコ語 |
yua |
サポテク語 |
zap |
ザーマ語 |
dje |
チワン語 |
za |
ズールー語 |
zu |
次の表は、読み取りモデルによる印字テキストの抽出と分析でサポートされる言語を示しています。
言語 |
コード (省略可能) |
アフリカーンス語 |
af |
アンギカ語 |
anp |
アラビア語 |
ar |
アストリア語 |
ast |
アワディ語 |
awa |
アゼルバイジャン語 |
az |
ベラルーシ語 (キリル) |
be 、 be-cyrl |
ベラルーシ語 (ラテン) |
be-latn |
バゲーリー語 |
bfy |
マハス パハリー語 |
bfz |
ブルガリア語 |
bg |
ハリヤーンウィー語 |
bgc |
Bhojpuri |
bho |
ビスラマ語 |
bi |
ブンデーリー語 |
bns |
ブルトン語 |
br |
ブラジュ語 |
bra |
ボド語 |
brx |
ボスニア語 |
bs |
ブリヤート語 |
bua |
カタロニア語 |
ca |
セブアノ語 |
ceb |
チャモロ語 |
ch |
モンテネグロ語 (ラテン) |
cnr 、 cnr-latn |
モンテネグロ語 (キリル) |
cnr-cyrl |
コルシカ語 |
co |
クリミア タタール語 |
crh |
チェコ語 |
cs |
カシュビア語 |
csb |
ウェールズ語 |
cy |
デンマーク語 |
da |
ドイツ語 |
de |
ディマール語 |
dhi |
ドーグリー語 |
doi |
低地ソルブ語 |
dsb |
英語 |
en |
スペイン語 |
es |
エストニア語 |
et |
バスク語 |
eu |
ペルシャ語 |
fa |
フィンランド語 |
fi |
フィリピン語 |
fil |
Language |
コード (省略可能) |
フィジー語 |
fj |
フェロー語 |
fo |
フランス語 |
fr |
フリウリ語 |
fur |
西フリジア語 |
fy |
アイルランド語 |
ga |
ガガウズ語 |
gag |
スコットランド ゲール語 |
gd |
キリバス語 |
gil |
ガリシア語 |
gl |
ゴーンディー語 |
gon |
マン語 |
gv |
グルン語 |
gvr |
ハワイ語 |
haw |
ヒンディー語 |
hi |
ハルビ語 |
hlb |
チャッティースガリー語 |
hne |
ハニ語 |
hni |
Ho |
hoc |
クロアチア語 |
hr |
上ソルブ語 |
hsb |
ハイチ・クレオール語 |
ht |
ハンガリー語 |
hu |
インターリングア |
ia |
インドネシア語 |
id |
アイスランド語 |
is |
イタリア語 |
it |
イヌクティトット語 |
iu |
日本語 |
|
ジャウンサーリー語 |
jns |
ジャワ文字 |
jv |
カラ カルパク語 (ラテン) |
kaa 、 kaa-latn |
カラ カルパク語 (キリル) |
kaa-cyrl |
カチン語 |
kac |
カーボベルデ・クレオール語 |
kea |
コルク語 |
kfq |
カシ語 |
kha |
カザフ語 (ラテン) |
kk 、 kk-latn |
カザフ語 (キリル) |
kk-cyrl |
カラーリット語 |
kl |
カリン語 |
klr |
マルト語 |
kmj |
Language |
コード (省略可能) |
韓国語 |
|
コスラエ語 |
kos |
コリャーク語 |
kpy |
カラチャイ バルカル語 |
krc |
クルク語 |
kru |
ケルシュ語 |
ksh |
クルド語 (ラテン文字) |
ku 、 ku-latn |
クルド語 (アラビア文字) |
ku-arab |
クムク語 |
kum |
コーンウォール語 |
kw |
キルギス語 |
ky |
ラテン語 |
la |
ルクセンブルク語 |
lb |
ラコタ語 |
lkt |
リトアニア語 |
lt |
マオリ語 |
mi |
モンゴル語 |
mn |
マラーティー語 |
mr |
マレー語 |
ms |
マルタ語 |
mt |
モン語 (Daw ) |
mww |
エルジャ語 |
myv |
ナポリ語 |
nap |
ネパール語 |
ne |
ニウエ語 |
niu |
オランダ語 |
nl |
ノルウェー語 |
no |
ノガイ語 |
nog |
オクシタン語 |
oc |
オセット語 |
os |
パンジャブ語 |
pa |
ポーランド語 |
pl |
ダリー語 |
prs |
パシュトー語 |
ps |
ポルトガル語 |
pt |
キチェ語 |
quc |
カムリング語 |
rab |
ロマンシュ語 |
rm |
ルーマニア語 |
ro |
ロシア語 |
ru |
サンスクリット語 |
sa |
サンタール語 |
sat |
Language |
コード (省略可能) |
サドリ語 |
sck |
スコットランド語 |
sco |
スロバキア語 |
sk |
スロベニア語 |
sl |
サモア語 |
sm |
南部サーミ語 |
sma |
北サーミ語 |
sme |
ルレ サーミ語 |
smj |
イナリ サーミ語 |
smn |
スコルト サーミ語 |
sms |
ソマリ語 |
so |
アルバニア語 |
sq |
セルビア語 (ラテン) |
sr 、 sr-latn |
シルマウリ語 |
srx |
スウェーデン語 |
sv |
スワヒリ語 |
sw |
テトゥン語 |
tet |
タジク語 |
tg |
タンミ語 |
thf |
トルクメン語 |
tk |
トンガ |
to |
トルコ語 |
tr |
タタール語 |
tt |
トゥバ語 |
tyv |
ウイグル語 |
ug |
ウルドゥ語 |
ur |
ウズベク語 (ラテン) |
uz 、 uz-latn |
ウズベク語 (キリル) |
uz-cyrl |
ウズベク語 (アラビア語) |
uz-arab |
ヴォラピュク |
vo |
ヴァリス語 |
wae |
カーングリー語 |
xnr |
ユカテコ語 |
yua |
チワン語 |
za |
中国語 (漢語 (簡体字)) |
zh 、 zh-hans |
中国語 (漢語 (繁体字)) |
zh-hant |
ズールー語 |
zu |
次の表は、読み取りモデルによる手書きテキストの抽出と分析でサポートされる言語を示しています。
言語 |
言語コード (省略可能) |
言語 |
言語コード (省略可能) |
英語 |
en |
日本語 |
ja |
簡体中国語 |
zh-Hans |
韓国語 |
ko |
フランス語 |
fr |
ポルトガル語 |
pt |
ドイツ語 |
de |
スペイン語 |
es |
イタリア語 |
it |
ロシア語 |
ru |
タイ語 |
th |
アラビア語 |
ar |
次の表は、読み取りモデルによる手書きテキストの抽出と分析でサポートされる言語を示しています。
言語 |
言語コード (省略可能) |
言語 |
言語コード (省略可能) |
英語 |
en |
日本語 |
ja |
簡体中国語 |
zh-Hans |
韓国語 |
ko |
フランス語 |
fr |
ポルトガル語 |
pt |
ドイツ語 |
de |
スペイン語 |
es |
イタリア語 |
it |
|
|
次の表は、読み取りモデルによる手書きテキストの抽出と分析でサポートされる言語を示しています。
言語 |
言語コード (省略可能) |
言語 |
言語コード (省略可能) |
英語 |
en |
日本語 |
ja |
簡体中国語 |
zh-Hans |
韓国語 |
ko |
フランス語 |
fr |
ポルトガル語 |
pt |
ドイツ語 |
de |
スペイン語 |
es |
イタリア語 |
it |
|
|
Read model API では、ドキュメントにおける次の言語の言語検出がサポートされています。 この一覧には、テキスト抽出では現在サポートされない言語が含まれている場合があります。
重要
言語検出
- Document Intelligence の読み取りモデルでは、言語の存在を "検出" して、検出された言語の言語コードを返すことができます。
検出された言語と抽出された言語
- このセクションでは、読み取りモデル (存在する場合) を使用してドキュメントから検出できる言語を示します。
- この一覧は、テキストの抽出がサポートされている言語の一覧とは異なります。これは、各モデルの上記のセクションで指定されています。
Language |
コード |
アフリカーンス語 |
af |
アルバニア語 |
sq |
アムハラ語 |
am |
アラビア語 |
ar |
アルメニア語 |
hy |
アッサム語 |
as |
アゼルバイジャン語 |
az |
バスク語 |
eu |
ベラルーシ語 |
be |
ベンガル語 |
bn |
ボスニア語 |
bs |
ブルガリア語 |
bg |
ミャンマー語 |
my |
カタロニア語 |
ca |
中央クメール語 |
km |
中国語 |
zh |
簡体中国語 |
zh_chs |
中国語 (繁体字) |
zh_cht |
コルシカ語 |
co |
クロアチア語 |
hr |
チェコ語 |
cs |
デンマーク語 |
da |
ダリー語 |
prs |
ディベヒ語 |
dv |
オランダ語 |
nl |
英語 |
en |
エスペラント語 |
eo |
エストニア語 |
et |
フィジー語 |
fj |
フィンランド語 |
fi |
フランス語 |
fr |
ガリシア語 |
gl |
ジョージア語 |
ka |
ドイツ語 |
de |
ギリシャ語 |
el |
グジャラート語 |
gu |
ハイチ・クレオール語 |
ht |
ハウサ語 |
ha |
ヘブライ語 |
he |
ヒンディー語 |
hi |
ミャオ語 |
mww |
ハンガリー語 |
hu |
アイスランド語 |
is |
イボ語 |
ig |
インドネシア語 |
id |
イヌクティトット語 |
iu |
アイルランド語 |
ga |
イタリア語 |
it |
日本語 |
ja |
ジャワ文字 |
jv |
カンナダ語 |
kn |
カザフ語 |
kk |
キニヤルワンダ語 |
rw |
キルギス語 |
ky |
韓国語 |
ko |
クルド語 |
ku |
ラオス語 |
lo |
ラテン語 |
la |
言語 |
コード |
ラトビア語 |
lv |
リトアニア語 |
lt |
ルクセンブルク語 |
lb |
マケドニア語 |
mk |
マダガスカル語 |
mg |
マレー語 |
ms |
マラヤーラム語 |
ml |
マルタ語 |
mt |
マオリ語 |
mi |
マラーティー語 |
mr |
モンゴル語 |
mn |
ネパール語 |
ne |
ノルウェー語 |
no |
ノルウェー語ニーノシュク |
nn |
オディア語 |
or |
パシュトウ語 |
ps |
ペルシャ語 |
fa |
ポーランド語 |
pl |
Portuguese |
pt |
パンジャーブ語 |
pa |
オトミ語 |
otq |
ルーマニア語 |
ro |
ロシア語 |
ru |
サモア語 |
sm |
セルビア語 |
sr |
ショナ語 |
sn |
シンド語 |
sd |
シンハラ語 |
si |
スロバキア語 |
sk |
スロベニア語 |
sl |
ソマリ語 |
so |
スペイン語 |
es |
スンダ文字 |
su |
スワヒリ語 |
sw |
スウェーデン語 |
sv |
タガログ語 |
tl |
タヒチ語 |
ty |
タジク語 |
tg |
タミル語 |
ta |
タタール語 |
tt |
テルグ語 |
te |
タイ語 |
th |
チベット語 |
bo |
ティグリニア語 |
ti |
トンガ語 |
to |
トルコ語 |
tr |
トルクメン語 |
tk |
ウクライナ語 |
uk |
ウルドゥ語 |
ur |
ウズベク語 |
uz |
ベトナム語 |
vi |
ウェールズ語 |
cy |
コサ語 |
xh |
イディッシュ語 |
yi |
ヨルバ語 |
yo |
ユカテコ語 |
yua |
ズールー語 |
zu |
Layout
モデル ID: prebuilt-layout
次の表は、印字テキストでサポートされている言語を示しています。
Language |
コード (省略可能) |
アバザ語 |
abq |
アブハズ語 |
ab |
アチェ語 |
ace |
アチョリ語 |
ach |
アダングメ語 |
ada |
アディゲ語 |
ady |
アファール語 |
aa |
アフリカーンス語 |
af |
アカン語 |
ak |
アルバニア語 |
sq |
アルゴンキン語 |
alq |
アンギカ語 (デーヴァナーガリー) |
anp |
アラビア語 |
ar |
アストリア語 |
ast |
アス語 (タンザニア) |
asa |
アバール語 |
av |
アワディー語 (デーヴァナーガリー) |
awa |
アイマラ語 |
ay |
アゼルバイジャン語 (ラテン) |
az |
バフィア語 |
ksf |
バゲーリー語 |
bfy |
バンバラ語 |
bm |
バシキール語 |
ba |
バスク語 |
eu |
ベラルーシ語 (キリル) |
be 、 be-cyrl |
ベラルーシ語 (ラテン) |
be 、 be-latn |
ビンバ語 (ザンビア) |
bem |
ベナ語 (タンザニア) |
bez |
ボージュプリー語 (デーヴァナーガリー) |
bho |
ビコル語 |
bik |
ビニ語 |
bin |
ビスラマ語 |
bi |
ボド語 (デーヴァナーガリー) |
brx |
ボスニア語 (ラテン) |
bs |
ブラジュバー語 |
bra |
ブルトン語 |
br |
ブルガリア語 |
bg |
ブンデーリー語 |
bns |
ブリヤート語 (キリル) |
bua |
カタロニア語 |
ca |
セブアノ語 |
ceb |
チャムリング語 |
rab |
チャモロ語 |
ch |
チェチェン語 |
ce |
チャッティースガリー語 (デーヴァナーガリー) |
hne |
チガ語 |
cgg |
中国語 (簡体字) |
zh-Hans |
中国語繁体字 |
zh-Hant |
チョクトー語 |
cho |
チュクチ語 |
ckt |
チュワシュ語 |
cv |
コーンウォール語 |
kw |
コルシカ語 |
co |
クリー語 |
cr |
クリーク語 |
mus |
クリミア タタール語 (ラテン) |
crh |
クロアチア語 |
hr |
カラス |
cro |
チェコ語 |
cs |
デンマーク語 |
da |
ダルグワ語 |
dar |
ダリー語 |
prs |
ディマール語 (デーヴァナーガリー) |
dhi |
ドーグリー語 (デーヴァナーガリー) |
doi |
ドゥアラ語 |
dua |
ドンガン語 |
dng |
オランダ語 |
nl |
エフィク語 |
efi |
English |
en |
エルジャ語 (キリル) |
myv |
エストニア語 |
et |
フェロー語 |
fo |
フィジー語 |
fj |
フィリピン語 |
fil |
フィンランド語 |
fi |
Language |
コード (省略可能) |
Fon |
fon |
フランス語 |
fr |
フリウリ語 |
fur |
Ga |
gaa |
ガガウズ語 (ラテン) |
gag |
ガリシア語 |
gl |
ガンダ語 |
lg |
ガヨ語 |
gay |
ドイツ語 |
de |
キリバス語 |
gil |
ゴーンディー語 (デーヴァナーガリー) |
gon |
ギリシャ語 |
el |
グリーンランド語 |
kl |
グアラニー語 |
gn |
グルン語 (デーヴァナーガリー) |
gvr |
グシイ語 |
guz |
ハイチ クレオール語 |
ht |
ハルビ語 (デーヴァナーガリー) |
hlb |
ハニ語 |
hni |
ハリヤーンウィー語 |
bgc |
ハワイ語 |
haw |
ヘブライ語 |
he |
ヘレロ語 |
hz |
ヒリガイノン語 |
hil |
ヒンディー語 |
hi |
ミャオ語 (ラテン) |
mww |
ホー語 (デーヴァナーガリー) |
hoc |
ハンガリー語 |
hu |
イバン語 |
iba |
アイスランド語 |
is |
イボ語 |
ig |
イロカノ語 |
ilo |
イナリ サーミ語 |
smn |
インドネシア語 |
id |
イングーシ語 |
inh |
インターリングア |
ia |
イヌクティトット語 (ラテン) |
iu |
アイルランド語 |
ga |
イタリア語 |
it |
日本語 |
ja |
ジャウンサーリー語 (デーヴァナーガリー) |
Jns |
ジャワ文字 |
jv |
ジョラ = フォニィ語 |
dyo |
カバルダ語 |
kbd |
カーボベルデ・クレオール語 |
kea |
カチン語 (ラテン) |
kac |
カレンジン語 |
kln |
カルムイク語 |
xal |
カーングリー語 (デーヴァナーガリー) |
xnr |
カヌリ語 |
kr |
カラチャイ バルカル語 |
krc |
カラ カルパク語 (キリル) |
kaa-cyrl |
カラ カルパク語 (ラテン) |
kaa |
カシュビア語 |
csb |
カザフ語 (キリル) |
kk-cyrl |
カザフ語 (ラテン) |
kk-latn |
ハカス語 |
kjh |
カリン語 |
klr |
カシ語 |
kha |
キチェ語 |
quc |
キクユ語 |
ki |
キルディン サーミ語 |
sjd |
キニヤルワンダ語 |
rw |
コミ語 |
kv |
コンゴ語 |
kg |
韓国語 |
ko |
コルク語 |
kfq |
コリャーク語 |
kpy |
コスラエ語 |
kos |
クペレ語 |
kpe |
クワニャマ語 |
kj |
クムク語 (キリル) |
kum |
クルド語 (アラビア文字) |
ku-arab |
クルド語 (ラテン文字) |
ku-latn |
Language |
コード (省略可能) |
クルク語 (デーヴァナーガリー) |
kru |
キルギス語 (キリル) |
ky |
Lak |
lbe |
ラコタ語 |
lkt |
ラテン語 |
la |
ラトビア語 |
lv |
レズギン語 |
lex |
リンガラ語 |
ln |
リトアニア語 |
lt |
低地ソルブ語 |
dsb |
ロジ語 |
loz |
ルレ サーミ語 |
smj |
ルオ語 (ケニアおよびタンザニア) |
luo |
ルクセンブルク語 |
lb |
ルヒヤ語 |
luy |
マケドニア語 |
mk |
マチャメ語 |
jmc |
マデュラ語 |
mad |
マハス パハリー語 (デーヴァナーガリー) |
bfz |
マクアミート語 |
mgh |
マコンデ語 |
kde |
マダガスカル語 |
mg |
マレー語 (ラテン) |
ms |
マルタ語 |
mt |
マルト語 (デーヴァナーガリー) |
kmj |
マンディンカ語 |
mnk |
マン語 |
gv |
マオリ語 |
mi |
マプチェ語 |
arn |
マラーティー語 |
mr |
マリ語 (ロシア) |
chm |
マサイ語 |
mas |
メンデ語 (シエラレオネ) |
men |
メル語 |
mer |
Meta' |
mgo |
ミナンカバウ語 |
min |
モホーク語 |
moh |
モンゴル語 (キリル) |
mn |
モンゴウドウ語 |
mog |
モンテネグロ語 (キリル) |
cnr-cyrl |
モンテネグロ語 (ラテン) |
cnr-latn |
モーリシャス語 |
mfe |
マンダン語 |
mua |
ナワトル語 |
nah |
ナバホ語 |
nv |
ンドンガ語 |
ng |
ナポリ語 |
nap |
ネパール語 |
ne |
ンゴンバ語 |
jgo |
ニウエ語 |
niu |
ノガイ語 |
nog |
北ンデベレ語 |
nd |
北部サーミ語 (ラテン) |
sme |
ノルウェー語 |
no |
ニャンジャ語 |
ny |
ニヤンコレ語 |
nyn |
ンゼマ語 |
nzi |
オクシタン語 |
oc |
オジブワ語 |
oj |
オロモ語 |
om |
オセット語 |
os |
パンパンガ語 |
pam |
パンガシナン語 |
pag |
パピアメント語 |
pap |
パシュトウ語 |
ps |
ペディ語 |
nso |
ペルシャ語 |
fa |
ポーランド語 |
pl |
(ブラジル) |
pt |
パンジャーブ語 (アラビア) |
pa |
ケチュア語 |
qu |
リプアーリ語 |
ksh |
ルーマニア語 |
ro |
ロマンシュ語 |
rm |
ランディ語 |
rn |
ロシア語 |
ru |
Language |
コード (省略可能) |
Rwa |
rwk |
サドリ語 (デーヴァナーガリー) |
sck |
サハ語 |
sah |
サンブル語 |
saq |
サモア語 (ラテン) |
sm |
サンゴ語 |
sg |
サング語 (ガボン) |
snq |
サンスクリット語 (デーヴァナーガリー) |
sa |
サンタル語 (デーヴァナーガリー) |
sat |
スコットランド語 |
sco |
スコットランド ゲール語 |
gd |
セナ語 |
seh |
セルビア語 (キリル) |
sr-cyrl |
セルビア語 (ラテン) |
sr 、 sr-latn |
シャンバラ語 |
ksb |
ショナ語 |
sn |
ブラックフット語 |
bla |
スルマウリ語 (デーヴァナーガリー) |
srx |
スコルト サーミ語 |
sms |
スロバキア語 |
sk |
スロベニア語 |
sl |
ソガ語 |
xog |
ソマリ語 (アラビア語) |
so |
ソマリ語 (ラテン) |
so-latn |
ソンガイ語 |
son |
南ンデベル語 |
nr |
南アルタイ語 |
alt |
南部サーミ語 |
sma |
南ソト語 |
st |
スペイン語 |
es |
スンダ文字 |
su |
スワヒリ語 (ラテン) |
sw |
スワジ語 |
ss |
スウェーデン語 |
sv |
タバサラン語 |
tab |
タハディット語 |
shi |
タヒチ語 |
ty |
タイタ語 |
dav |
タジク語 (キリル) |
tg |
タミル語 |
ta |
タタール語 (キリル) |
tt-cyrl |
タタール語 (ラテン) |
tt |
テソ語 |
teo |
テトゥン語 |
tet |
タイ語 |
th |
タンミ語 |
thf |
トク ピシン語 |
tpi |
トンガ語 |
to |
ツォンガ語 |
ts |
ツワナ語 |
tn |
トルコ語 |
tr |
トルクメン語 (ラテン) |
tk |
トゥヴァ語 |
tyv |
ウドムルト語 |
udm |
ウイグル語 (キリル文字) |
ug-cyrl |
ウクライナ語 |
uk |
上ソルブ語 |
hsb |
ウルドゥ語 |
ur |
ウイグル語 (アラビア語) |
ug |
ウズベク語 (アラビア語) |
uz-arab |
ウズベク語 (キリル) |
uz-cyrl |
ウズベク語 (ラテン) |
uz |
ベトナム語 |
vi |
ヴォラピュク |
vo |
ブンホ語 |
vun |
ヴァリス語 |
wae |
ウェールズ語 |
cy |
西フリジア語 |
fy |
ウォロフ語 |
wo |
コサ語 |
xh |
ユカテコ語 |
yua |
サポテク語 |
zap |
ザーマ語 |
dje |
チワン語 |
za |
ズールー語 |
zu |
次の表は、レイアウト モデルによる印字テキストの抽出と分析でサポートされる言語を示しています。
Language |
コード (省略可能) |
アフリカーンス語 |
af |
アンギカ語 |
anp |
アラビア語 |
ar |
アストリア語 |
ast |
アワディ語 |
awa |
アゼルバイジャン語 |
az |
ベラルーシ語 (キリル) |
be 、 be-cyrl |
ベラルーシ語 (ラテン) |
be-latn |
バゲーリー語 |
bfy |
マハス パハリー語 |
bfz |
ブルガリア語 |
bg |
ハリヤーンウィー語 |
bgc |
Bhojpuri |
bho |
ビスラマ語 |
bi |
ブンデーリー語 |
bns |
ブルトン語 |
br |
ブラジュ語 |
bra |
ボド語 |
brx |
ボスニア語 |
bs |
ブリヤート語 |
bua |
カタロニア語 |
ca |
セブアノ語 |
ceb |
チャモロ語 |
ch |
モンテネグロ語 (ラテン) |
cnr 、 cnr-latn |
モンテネグロ語 (キリル) |
cnr-cyrl |
コルシカ語 |
co |
クリミア タタール語 |
crh |
チェコ語 |
cs |
カシュビア語 |
csb |
ウェールズ語 |
cy |
デンマーク語 |
da |
ドイツ語 |
de |
ディマール語 |
dhi |
ドーグリー語 |
doi |
低地ソルブ語 |
dsb |
英語 |
en |
スペイン語 |
es |
エストニア語 |
et |
バスク語 |
eu |
ペルシャ語 |
fa |
フィンランド語 |
fi |
フィリピン語 |
fil |
Language |
コード (省略可能) |
フィジー語 |
fj |
フェロー語 |
fo |
フランス語 |
fr |
フリウリ語 |
fur |
西フリジア語 |
fy |
アイルランド語 |
ga |
ガガウズ語 |
gag |
スコットランド ゲール語 |
gd |
キリバス語 |
gil |
ガリシア語 |
gl |
ゴーンディー語 |
gon |
マン語 |
gv |
グルン語 |
gvr |
ハワイ語 |
haw |
ヒンディー語 |
hi |
ハルビ語 |
hlb |
チャッティースガリー語 |
hne |
ハニ語 |
hni |
Ho |
hoc |
クロアチア語 |
hr |
上ソルブ語 |
hsb |
ハイチ・クレオール語 |
ht |
ハンガリー語 |
hu |
インターリングア |
ia |
インドネシア語 |
id |
アイスランド語 |
is |
イタリア語 |
it |
イヌクティトット語 |
iu |
日本語 |
|
ジャウンサーリー語 |
jns |
ジャワ文字 |
jv |
カラ カルパク語 (ラテン) |
kaa 、 kaa-latn |
カラ カルパク語 (キリル) |
kaa-cyrl |
カチン語 |
kac |
カーボベルデ・クレオール語 |
kea |
コルク語 |
kfq |
カシ語 |
kha |
カザフ語 (ラテン) |
kk 、 kk-latn |
カザフ語 (キリル) |
kk-cyrl |
カラーリット語 |
kl |
カリン語 |
klr |
マルト語 |
kmj |
Language |
コード (省略可能) |
韓国語 |
|
コスラエ語 |
kos |
コリャーク語 |
kpy |
カラチャイ バルカル語 |
krc |
クルク語 |
kru |
ケルシュ語 |
ksh |
クルド語 (ラテン文字) |
ku 、 ku-latn |
クルド語 (アラビア文字) |
ku-arab |
クムク語 |
kum |
コーンウォール語 |
kw |
キルギス語 |
ky |
ラテン語 |
la |
ルクセンブルク語 |
lb |
ラコタ語 |
lkt |
リトアニア語 |
lt |
マオリ語 |
mi |
モンゴル語 |
mn |
マラーティー語 |
mr |
マレー語 |
ms |
マルタ語 |
mt |
モン語 (Daw ) |
mww |
エルジャ語 |
myv |
ナポリ語 |
nap |
ネパール語 |
ne |
ニウエ語 |
niu |
オランダ語 |
nl |
ノルウェー語 |
no |
ノガイ語 |
nog |
オクシタン語 |
oc |
オセット語 |
os |
パンジャブ語 |
pa |
ポーランド語 |
pl |
ダリー語 |
prs |
パシュトー語 |
ps |
ポルトガル語 |
pt |
キチェ語 |
quc |
カムリング語 |
rab |
ロマンシュ語 |
rm |
ルーマニア語 |
ro |
ロシア語 |
ru |
サンスクリット語 |
sa |
サンタール語 |
sat |
Language |
コード (省略可能) |
サドリ語 |
sck |
スコットランド語 |
sco |
スロバキア語 |
sk |
スロベニア語 |
sl |
サモア語 |
sm |
南部サーミ語 |
sma |
北サーミ語 |
sme |
ルレ サーミ語 |
smj |
イナリ サーミ語 |
smn |
スコルト サーミ語 |
sms |
ソマリ語 |
so |
アルバニア語 |
sq |
セルビア語 (ラテン) |
sr 、 sr-latn |
シルマウリ語 |
srx |
スウェーデン語 |
sv |
スワヒリ語 |
sw |
テトゥン語 |
tet |
タジク語 |
tg |
タンミ語 |
thf |
トルクメン語 |
tk |
トンガ |
to |
トルコ語 |
tr |
タタール語 |
tt |
トゥバ語 |
tyv |
ウイグル語 |
ug |
ウルドゥ語 |
ur |
ウズベク語 (ラテン) |
uz 、 uz-latn |
ウズベク語 (キリル) |
uz-cyrl |
ウズベク語 (アラビア語) |
uz-arab |
ヴォラピュク |
vo |
ヴァリス語 |
wae |
カーングリー語 |
xnr |
ユカテコ語 |
yua |
チワン語 |
za |
中国語 (漢語 (簡体字)) |
zh 、zh-hans |
中国語 (漢語 (繁体字)) |
zh-hant |
ズールー語 |
zu |
Language |
言語コード |
アフリカーンス語 |
af |
アルバニア語 |
sq |
アストリア語 |
ast |
バスク語 |
eu |
ビスラマ語 |
bi |
ブルトン語 |
br |
カタロニア語 |
ca |
セブアノ語 |
ceb |
チャモロ語 |
ch |
簡体中国語 |
zh-Hans |
繁体中国語 |
zh-Hant |
コーンウォール語 |
kw |
コルシカ語 |
co |
クリミア タタール語 (ラテン) |
crh |
チェコ語 |
cs |
デンマーク語 |
da |
オランダ語 |
nl |
英語 (印刷および手書き) |
en |
エストニア語 |
et |
フィジー語 |
fj |
フィリピン語 |
fil |
フィンランド語 |
fi |
フランス語 |
fr |
フリウリ語 |
fur |
ガリシア語 |
gl |
ドイツ語 |
de |
キリバス語 |
gil |
グリーンランド語 |
kl |
ハイチ・クレオール語 |
ht |
ハニ語 |
hni |
ミャオ語 (ラテン) |
mww |
ハンガリー語 |
hu |
インドネシア語 |
id |
インターリングア |
ia |
イヌクティトット語 (ラテン) |
iu |
アイルランド語 |
ga |
Language |
言語コード |
イタリア語 |
it |
日本語 |
ja |
ジャワ文字 |
jv |
キチェ語 |
quc |
カーボベルデ・クレオール語 |
kea |
カチン語 (ラテン) |
kac |
カラ・カルパク語 |
kaa |
カシュビア語 |
csb |
カシ語 |
kha |
韓国語 |
ko |
クルド語 (ラテン) |
kur |
ルクセンブルク語 |
lb |
マレー語 (ラテン) |
ms |
マン語 |
gv |
ナポリ語 |
nap |
ノルウェー語 |
no |
オクシタン語 |
oc |
ポーランド語 |
pl |
ポルトガル語 |
pt |
ロマンシュ語 |
rm |
スコットランド語 |
sco |
スコットランド ゲール語 |
gd |
スロベニア語 |
slv |
スペイン語 |
es |
スワヒリ語 (ラテン) |
sw |
スウェーデン語 |
sv |
タタール語 (ラテン) |
tat |
テトゥン語 |
tet |
トルコ語 |
tr |
高地ソルブ語 |
hsb |
ウズベク語 (ラテン) |
uz |
ヴォラピュク |
vo |
ヴァリス語 |
wae |
西フリジア語 |
fy |
ユカテコ語 |
yua |
チワン語 |
za |
ズールー語 |
zu |
次の表は、レイアウト モデルによる手書きテキストの抽出と分析でサポートされる言語を示しています。
言語 |
言語コード (省略可能) |
言語 |
言語コード (省略可能) |
英語 |
en |
日本語 |
ja |
簡体中国語 |
zh-Hans |
韓国語 |
ko |
フランス語 |
fr |
ポルトガル語 |
pt |
ドイツ語 |
de |
スペイン語 |
es |
イタリア語 |
it |
ロシア語 |
ru |
タイ語 |
th |
アラビア語 |
ar |
モデル ID: prebuilt-layout
次の表は、レイアウト モデルによる手書きテキストの抽出と分析でサポートされる言語を示しています。
言語 |
言語コード (省略可能) |
言語 |
言語コード (省略可能) |
英語 |
en |
日本語 |
ja |
簡体中国語 |
zh-Hans |
韓国語 |
ko |
フランス語 |
fr |
ポルトガル語 |
pt |
ドイツ語 |
de |
スペイン語 |
es |
イタリア語 |
it |
|
|
Note
Document Intelligence v2.1 では、手書きテキストの抽出はサポートされていません。
次の表は、レイアウト モデルによる手書きテキストの抽出と分析でサポートされる言語を示しています。
言語 |
言語コード (省略可能) |
言語 |
言語コード (省略可能) |
英語 |
en |
日本語 |
ja |
簡体中国語 |
zh-Hans |
韓国語 |
ko |
フランス語 |
fr |
ポルトガル語 |
pt |
ドイツ語 |
de |
スペイン語 |
es |
イタリア語 |
it |
ロシア語 |
ru |
タイ語 |
th |
アラビア語 |
ar |
一般ドキュメント
重要
Document Intelligence v4.0:2024-11-30 (GA) では、一般的なドキュメント モデル (prebuilt-document) がレイアウト (prebuilt-layout) に追加されます。 ドキュメントからキーと値のペア、選択マーク、テキスト、テーブル、構造を抽出するには、次のモデルを使用してください。
キーと値のペア |
version |
モデル ID |
クエリ文字列 features=keyValuePairs を指定したレイアウト モデル。 |
• v4:2024-11-30 (GA) • v3.1:2023-07-31 (GA) |
prebuilt-layout |
一般的なドキュメント モデル |
• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
モデル ID: prebuilt-document
次の表は、一般的なドキュメント モデルの言語サポートを示します。
モデル ID |
言語: ロケール コード |
既定値 |
事前構築済みドキュメント |
英語 (米国) - en-US |
英語 (米国) - en-US |