サービスのクォータと制限

[アーティクル]
01/16/2025

このコンテンツの適用対象: v4.0 (GA) | 以前のバージョン: v3.1 (GA) v3.0 (GA)

このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (GA)

この記事には、すべての価格レベルの Azure AI Document Intelligence サービスのクォータと制限に関するクイックリファレンスと詳細な説明の両方が記載されています。また、要求のスロットリングを回避するためのベストプラクティスについても説明します。

モデルの使用法

サポートされているドキュメントの種類	既読	Layout	事前構築済みのモデル	カスタムモデル	アドオン機能
PDF	✔️	✔️	✔️	✔️	✔️
画像: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`、`PPTX`、`XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = サポート対象 ✖️ = サポート対象外

Document Intelligence v4.0 2024-11-30 (GA) については、次の制限付きでページ機能とライン機能がサポートされます。

角度、幅/高さ、および単位はサポートされません。
検出されたオブジェクトごとの、境界ポリゴンまたは境界領域はサポートされません。
ページ範囲 (pages) はパラメーターとしてサポートされません。
lines オブジェクトはサポートされません。

サポートされているドキュメントの種類	既読	Layout	事前構築済みのモデル	カスタムモデル
PDF	✔️	✔️	✔️	✔️
画像: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`、`PPTX`、`XLS`	✔️	✖️	✖️	✖️

✔️ = サポート対象 ✖️ = サポート対象外

請求

Document Intelligence の課金は、モデルの種類と分析されたページ数に基づいて月単位で計算されます。 Azure portal のメトリックダッシュボードに使用状況メトリックがあります。このダッシュボードには、Azure AI Document Intelligence によって処理されるページ数が表示されます。 Azure 料金計算ツールを使用して、リソースに費やされた推定コストを確認できます。詳細な手順については、「使用量の確認とコストの見積もり」を参照してください。次に、いくつかの詳しい情報を記載します。

分析のためにドキュメントを送信すると、その要求で pages パラメーターを使用してページ範囲を指定しない限り、サービスではすべてのページを分析します。サービスで読み取り、OCR、またはレイアウトモデルを使用して Microsoft Excel および PowerPoint ドキュメントを分析する場合は、各 Excel ワークシートと PowerPoint スライドを 1 ページとしてカウントします。
サービスで PDF および TIFF ファイルを分析する場合は、PDF ファイル内の各ページまたは TIFF ファイル内の各画像を最大文字数の制限なしで 1 ページとしてカウントします。
サービスで読み取りおよびレイアウトモデルでサポートされている Microsoft Word および HTML ファイルを分析する場合は、ページをそれぞれ 3,000 文字のブロック単位でカウントします。たとえば、ドキュメントに 7,000 文字が含まれている場合は、それぞれ 3,000 文字を含む 2 ページと 1,000 文字を含む 1 ページの合計 3 ページになります。
読み取りモデルとレイアウトモデルでは、Microsoft Word、Excel、PowerPoint、および HTML ファイルの埋め込み画像またはリンクされた画像の分析はサポートされていません。そのため、サービスでは、それらを追加された画像としてカウントしません。
カスタムモデルのトレーニングは、Document Intelligence では常に無料です。サービスでモデルを使用してドキュメントを分析する場合にのみ課金されます。
コンテナーの価格は、クラウドサービスの価格と同じです。
Document Intelligence には、すべての Document Intelligence 機能をテストできる Free レベル (F0) が用意されています。 Free レベルの場合、分析応答が要求の最初の 2 ページのみに制限されます。
Document Intelligence には、大規模ワークロード用のコミットメントベースの価格モデルがあります。
レイアウトモデルは、カスタムトレーニング用のデータセットのラベルを生成するために必要です。カスタムトレーニングに使用するデータセットに使用可能なラベルファイルがない場合は、自動的に生成され、レイアウトモデルの使用に対して課金が行われます。

Quota	Free (F0)¹	Standard (S0)
1 秒あたりの分析トランザクション数の制限	1	15 (既定値)
調整可能	いいえ	はい ²
1 秒あたりの Get 操作数の制限	1	50 (既定値)
調整可能	いいえ	はい ²
1 秒あたりのモデル管理操作数の制限	1	5 (既定値)
調整可能	いいえ	はい ²
1 秒あたりの List 操作数の制限	1	10 (既定値)
調整可能	いいえ	はい ²
ドキュメントの最大サイズ	4 MB	500 MB
調整可能	いいえ	いいえ
ページの最大数 (分析)	2	2000
調整可能	いいえ	いいえ
ラベルファイルの最大サイズ	10 MB	10 MB
調整可能	いいえ	いいえ
OCR json 応答の最大サイズ	500 MB	500 MB
調整可能	いいえ	いいえ
テンプレートモデルの最大数	500	5000
調整可能	いいえ	いいえ
ニューラルモデルの最大数	100	500
調整可能	いいえ	いいえ

カスタムモデルの使用

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットのサイズニューラルと生成**	1 GB ³	1 GB (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズテンプレート**	50 MB ⁴	50 MB (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) テンプレート**	500	500 (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) ニューラルと生成**	50,000	50,000 (既定値)
調整可能	いいえ	いいえ
カスタムニューラルモデルのトレーニング	10 時間/月 ⁵	制限なし (時間単位の支払い)、毎月最初の 10 時間は無料
調整可能	いいえ	はい ³
*ページの最大数 (トレーニング) 分類子**	10,000	10,000 (既定値)
調整可能	いいえ	いいえ
*ドキュメントの種類 (クラス) の最大数分類子**	500	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズ分類子**	1GB	2GB (既定値)
調整可能	いいえ	いいえ
*クラスあたりの最小サンプル数分類子**	5	5 (既定値)
調整可能	いいえ	いいえ

カスタムモデルの使用

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	200 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズニューラル**	1 GB ³	1 GB (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズテンプレート**	50 MB ⁴	50 MB (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) テンプレート**	500	500 (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) ニューラル**	50,000	50,000 (既定値)
調整可能	いいえ	いいえ
カスタムニューラルモデルのトレーニング	1 か月あたり 10	1 か月あたり 20
調整可能	いいえ	はい ³
*ページの最大数 (トレーニング) 分類子**	10,000	10,000 (既定値)
調整可能	いいえ	いいえ
*ドキュメントの種類 (クラス) の最大数分類子**	500	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズ分類子**	1GB	1GB (既定値)
調整可能	いいえ	いいえ
*クラスあたりの最小サンプル数分類子**	5	5 (既定値)
調整可能	いいえ	いいえ

カスタムモデルの使用

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	200 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズニューラル**	1 GB ³	1 GB (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズテンプレート**	50 MB ⁴	50 MB (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) テンプレート**	500	500 (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) ニューラル**	50,000	50,000 (既定値)
調整可能	いいえ	いいえ
カスタムニューラルモデルのトレーニング	1 か月あたり 10	1 か月あたり 20
調整可能	いいえ	はい ³
*ページの最大数 (トレーニング) 分類子**	10,000	10,000 (既定値)
調整可能	いいえ	いいえ
*ドキュメントの種類 (クラス) の最大数分類子**	500	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズ分類子**	1GB	1GB (既定値)
調整可能	いいえ	いいえ
*クラスあたりの最小サンプル数分類子**	5	5 (既定値)
調整可能	いいえ	いいえ

カスタムモデルの制限

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	200 (既定値)
調整可能	いいえ	いいえ
トレーニングデータセットサイズ	50 MB	50 MB (既定値)
調整可能	いいえ	いいえ
ページの最大数 (トレーニング)	500	500 (既定値)
調整可能	いいえ	いいえ

¹Free (F0) 価格レベルについては、価格ページで月額料金も参照してください。
²ベストプラクティスおよび調整手順を参照してください。
³ ニューラルモデルのトレーニング数は、暦月ごとにリセットされます。サポートリクエストを提出し、毎月のトレーニング制限を引き上げます。 v4.0 API 以降、カレンダー月内でトレーニング要求が 20 件を超える場合は、トレーニングレベルで課金されます。詳細については、価格のページを参照してください。

⁴ この制限は、ラベル付け関連の更新の前にトレーニングデータセットフォルダー内で見つかるすべてのドキュメントに適用されます。

⁵ この制限は、v 4.0 (2024-11-30 GA) カスタムニューラルモデルにのみ適用されます。 v 4.0以降、大規模なドキュメントのトレーニングがより長期間サポートされます (最大 10 時間無料。その後に料金が発生します)。詳細については、カスタムニューラルモデルのページを参照してください。

詳細な説明、クォータの調整、およびベストプラクティス

サポートチケットを提出して増加を要求すると、既定の制限を引き上げることができます。クォータの引き上げを要求する前に (該当する場合)、それが必要であることを確認します。 Document Intelligence サービスでは、自動スケーリングを用いて必要なコンピューティングリソース on-demand を提供し、顧客のコストを低く抑え、過剰なハードウェア容量を維持しないようにして未使用のリソースをプロビジョニング解除します。

アプリケーションから応答コード 429 ("要求数が多すぎます") が返された場合、次のいずれかまたは複数の 1 秒あたりのトランザクション数制限 (TPS) のしきい値を超えています。

1 秒あたりの分析トランザクション数の制限 分析要求の送信 (POST) に関する TPS
1 秒あたりの Get 操作数の制限 分析操作の結果のポーリング (GET) に関する TPS
1 秒あたりのモデル管理操作数の制限 ビルド/トレーニングやコピーなどのモデル管理に関連する操作数。
1 秒あたりの List 操作数の制限 モデルや操作の一覧表示に関連する操作数。

自動スケーリング時のスロットリングを緩和するための一般的なベストプラクティス

スロットリングに関連する問題 (応答コード 429) を最小限に抑えるには、次の手法を使用することをお勧めします。

アプリケーションで再試行ロジックを実装します。
ワークロードが急激に変化しないようにします。ワークロードは徐々に増やします
例。アプリケーションで Document Intelligence が使用されており、現在のワークロードは 10 TPS (1 秒あたりのトランザクション数) です。次の 1 秒間で、負荷を 40 TPS に増やしたとします。その結果、分析操作の送信に関する TPS 制限の 15 を超えるため、一部の要求に対して応答コード 429 が返されます。処理をバックオフして 15 TPS 未満に抑えるか、より多くのトランザクションをサポートするために TPS の引き上げを要求できます。

次のセクションでは、クォータを調整する特定のケースについて説明します。 Document Intelligence: 同時要求の制限を引き上げる方法に移動

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

既定では、1 秒あたりのトランザクション数は、Document Intelligence リソースに対して 1 秒あたり 15 トランザクションに制限されます。 Standard 価格レベルでは、この数を増やすことができます。要求を送信する前に、こちらのセクションの資料について理解していること、およびこれらのベストプラクティスを把握していることを確認してください。

最初の手順は、自動スケーリングを有効にすることです。このドキュメントに従って、リソースの自動スケーリングを有効にします * 自動スケーリングを有効にする。自動スケーリングを有効にすると、サービスに容量がある場合、リソースで、構成された TPS 制限を超えて要求を受け入れ続けることができます。その場合でも、要求が調整される可能性があります。

同時要求の上限を上げても、コストに直接影響することはありません。 Document Intelligence サービスでは、"使用した分だけ支払う" モデルを使用しています。この制限によって、要求のスロットリングが開始される前に、サービスをどの程度スケーリングできるかが定義されます。

さまざまな要求制限カテゴリの既定値は、Azure portal を使用して、リソースの [概要] ブレードにある [監視] タブで確認できます。

TPS を引き上げるためにサポートリクエストを作成して送信する

サポートリクエストを送信して、リソースの 1 秒あたりのトランザクション数 (TPS) の制限を引き上げる手順を開始します。

Azure ポータル
TPS の上限を引き上げる Document Intelligence リソースを選択します
[新しいサポートリクエスト] ([サポート + トラブルシューティング] グループ) を選択します。 Azure サブスクリプションと Azure リソースに関する情報が自動的に入力された新しいウィンドウが表示されます
[概要] を入力します (「Document Intelligence TPS の上限を引き上げる」など)
問題の種類フィールドに [クォータまたは使用状況の検証] を選択します。
[次へ: ソリューション] を選択します。
要求の作成を進めます
[詳細] フィールドで、[説明] フィールドに次の情報を入力します。
- 要求が Document Intelligence クォータに関するものであることを示すメモ。
- TPS に関して希望するスケーリングの目標値を指定 TPS の引き上げは無料ですが、お使いのワークロードに妥当な TPS のみを要求する必要があります。
- Azure リソース情報
- 必要な情報を入力して、[確認と作成] タブの [作成] ボタンを選択します。
- Azure portal 通知のサポートリクエスト番号をメモしておきます。 [サポート] を探して、この後の処理について確認します。

ワークロードパターンの例のベストプラクティス

この例では、自動スケーリングが進行中であることによって発生する可能性がある要求のスロットリングを軽減するために、次のようなアプローチを推奨しています。これは「正確なレシピ」ではなく、必要に応じて従い、調整するテンプレートにすぎません。

Document Intelligence リソースに既定の制限が設定されているとします。ワークロードを開始して、分析要求を送信します。完了を確認すると、応答コード 429 が返され、要求調整が頻繁に発生していることがわかった場合は、まず GET 分析応答要求にエクスポネンシャルバックオフを実装します。連続するエラー応答の再試行間で待機時間を徐々に長くします。たとえば、リクエスト間の遅延パターンを 2-5-13-34 にします。一般に、対応する POST 要求に対して 2 秒に 1 回以上応答分析取得を呼び出さないことをお勧めします。 analyze 応答には、retry-after ヘッダーも含まれます。これは、その要求の完了を確認するまでに待機する必要がある秒数を示します。

送信されるドキュメントの POST 要求の数が調整されていることがわかった場合は、要求間に遅延を追加することを検討してください。ワークロードでより高度な同時処理が必要な場合は、サポートリクエストを作成して、1 秒あたりのトランザクションのサービス制限を引き上げる必要があります。

一般に、運用環境に移行する前にワークロードとワークロードパターンをテストしておくことをお勧めします。

次のステップ

エラーコードとトラブルシューティングについて学習する

次の方法で共有

サービスのクォータと制限

モデルの使用法

請求

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの制限

詳細な説明、クォータの調整、およびベストプラクティス

自動スケーリング時のスロットリングを緩和するための一般的なベストプラクティス

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

TPS を引き上げるためにサポートリクエストを作成して送信する

ワークロードパターンの例のベストプラクティス

次のステップ

フィードバック

その他のリソース

次の方法で共有

サービスのクォータと制限

モデルの使用法

請求

カスタム モデルの使用

カスタム モデルの使用

カスタム モデルの使用

カスタム モデルの制限

詳細な説明、クォータの調整、およびベスト プラクティス

自動スケーリング時のスロットリングを緩和するための一般的なベスト プラクティス

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

TPS を引き上げるためにサポート リクエストを作成して送信する

ワークロード パターンの例のベスト プラクティス

次のステップ

フィードバック

その他のリソース

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの制限

詳細な説明、クォータの調整、およびベストプラクティス

自動スケーリング時のスロットリングを緩和するための一般的なベストプラクティス

TPS を引き上げるためにサポートリクエストを作成して送信する

ワークロードパターンの例のベストプラクティス