次の方法で共有


サービスのクォータと制限

このコンテンツの適用対象:checkmark v4.0 (GA) | 以前のバージョン: 青のチェックマーク v3.1 (GA) 青のチェックマーク v3.0 (GA)

このコンテンツの適用対象: checkmark v2.1 | 最新バージョン: 青のチェックマーク v4.0 (GA)

この記事には、すべての価格レベルの Azure AI Document Intelligence サービスのクォータと制限に関するクイック リファレンスと詳細な説明の両方が記載されています。 また、要求のスロットリングを回避するためのベスト プラクティスについても説明します。

モデルの使用法

サポートされているドキュメントの種類 既読 Layout 事前構築済みのモデル カスタム モデル アドオン機能
PDF ✔️ ✔️ ✔️ ✔️ ✔️
画像: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCXPPTXXLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = サポート対象 ✖️ = サポート対象外

Document Intelligence v4.0 2024-11-30 (GA) については、次の制限付きでページ機能とライン機能がサポートされます。

  • 角度、幅/高さ、および単位はサポートされません。
  • 検出されたオブジェクトごとの、境界ポリゴンまたは境界領域はサポートされません。
  • ページ範囲 (pages) はパラメーターとしてサポートされません。
  • lines オブジェクトはサポートされません。
サポートされているドキュメントの種類 既読 Layout 事前構築済みのモデル カスタム モデル
PDF ✔️ ✔️ ✔️ ✔️
画像: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCXPPTXXLS ✔️ ✖️ ✖️ ✖️

✔️ = サポート対象 ✖️ = サポート対象外

請求

Document Intelligence の課金は、モデルの種類と分析されたページ数に基づいて月単位で計算されます。 Azure portal のメトリック ダッシュボードに使用状況メトリックがあります。 このダッシュボードには、Azure AI Document Intelligence によって処理されるページ数が表示されます。 Azure 料金計算ツールを使用して、リソースに費やされた推定コストを確認できます。 詳細な手順については、「使用量の確認とコストの見積もり」を参照してください。 次に、いくつかの詳しい情報を記載します。

  • 分析のためにドキュメントを送信すると、その要求で pages パラメーターを使用してページ範囲を指定しない限り、サービスではすべてのページを分析します。 サービスで読み取り、OCR、またはレイアウト モデルを使用して Microsoft Excel および PowerPoint ドキュメントを分析する場合は、各 Excel ワークシートと PowerPoint スライドを 1 ページとしてカウントします。

  • サービスで PDF および TIFF ファイルを分析する場合は、PDF ファイル内の各ページまたは TIFF ファイル内の各画像を最大文字数の制限なしで 1 ページとしてカウントします。

  • サービスで読み取りおよびレイアウト モデルでサポートされている Microsoft Word および HTML ファイルを分析する場合は、ページをそれぞれ 3,000 文字のブロック単位でカウントします。 たとえば、ドキュメントに 7,000 文字が含まれている場合は、それぞれ 3,000 文字を含む 2 ページと 1,000 文字を含む 1 ページの合計 3 ページになります。

  • 読み取りモデルとレイアウト モデルでは、Microsoft Word、Excel、PowerPoint、および HTML ファイルの埋め込み画像またはリンクされた画像の分析はサポートされていません。 そのため、サービスでは、それらを追加された画像としてカウントしません。

  • カスタム モデルのトレーニングは、Document Intelligence では常に無料です。 サービスでモデルを使用してドキュメントを分析する場合にのみ課金されます。

  • コンテナーの価格は、クラウド サービスの価格と同じです。

  • Document Intelligence には、すべての Document Intelligence 機能をテストできる Free レベル (F0) が用意されています。 Free レベルの場合、分析応答が要求の最初の 2 ページのみに制限されます。

  • Document Intelligence には、大規模ワークロード用のコミットメントベースの価格モデルがあります。

  • レイアウト モデルは、カスタム トレーニング用のデータセットのラベルを生成するために必要です。 カスタム トレーニングに使用するデータセットに使用可能なラベル ファイルがない場合は、自動的に生成され、レイアウト モデルの使用に対して課金が行われます。

Quota Free (F0)1 Standard (S0)
1 秒あたりの分析トランザクション数の制限 1 15 (既定値)
調整可能 いいえ はい 2
1 秒あたりの Get 操作数の制限 1 50 (既定値)
調整可能 いいえ はい 2
1 秒あたりのモデル管理操作数の制限 1 5 (既定値)
調整可能 いいえ はい 2
1 秒あたりの List 操作数の制限 1 10 (既定値)
調整可能 いいえ はい 2
ドキュメントの最大サイズ 4 MB 500 MB
調整可能 いいえ いいえ
ページの最大数 (分析) 2 2000
調整可能 いいえ いいえ
ラベル ファイルの最大サイズ 10 MB 10 MB
調整可能 いいえ いいえ
OCR json 応答の最大サイズ 500 MB 500 MB
調整可能 いいえ いいえ
テンプレート モデルの最大数 500 5000
調整可能 いいえ いいえ
ニューラル モデルの最大数 100 500
調整可能 いいえ いいえ

カスタム モデルの使用

Quota Free (F0) 1 Standard (S0)
Compose モデルの制限 5 500 (既定値)
調整可能 いいえ いいえ
トレーニング データセットのサイズ * ニューラルと生成 1 GB 3 1 GB (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * テンプレート 50 MB 4 50 MB (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) * テンプレート 500 500 (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) * ニューラルと生成 50,000 50,000 (既定値)
調整可能 いいえ いいえ
カスタム ニューラル モデルのトレーニング 10 時間/月 5 制限なし (時間単位の支払い)、毎月最初の 10 時間は無料
調整可能 いいえ はい 3
ページの最大数 (トレーニング) * 分類子 10,000 10,000 (既定値)
調整可能 いいえ いいえ
ドキュメントの種類 (クラス) の最大数 * 分類子 500 500 (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * 分類子 1GB 2GB (既定値)
調整可能 いいえ いいえ
クラスあたりの最小サンプル数 * 分類子 5 5 (既定値)
調整可能 いいえ いいえ

カスタム モデルの使用

Quota Free (F0) 1 Standard (S0)
Compose モデルの制限 5 200 (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * ニューラル 1 GB 3 1 GB (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * テンプレート 50 MB 4 50 MB (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) * テンプレート 500 500 (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) * ニューラル 50,000 50,000 (既定値)
調整可能 いいえ いいえ
カスタム ニューラル モデルのトレーニング 1 か月あたり 10 1 か月あたり 20
調整可能 いいえ はい 3
ページの最大数 (トレーニング) * 分類子 10,000 10,000 (既定値)
調整可能 いいえ いいえ
ドキュメントの種類 (クラス) の最大数 * 分類子 500 500 (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * 分類子 1GB 1GB (既定値)
調整可能 いいえ いいえ
クラスあたりの最小サンプル数 * 分類子 5 5 (既定値)
調整可能 いいえ いいえ

カスタム モデルの使用

Quota Free (F0) 1 Standard (S0)
Compose モデルの制限 5 200 (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * ニューラル 1 GB 3 1 GB (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * テンプレート 50 MB 4 50 MB (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) * テンプレート 500 500 (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) * ニューラル 50,000 50,000 (既定値)
調整可能 いいえ いいえ
カスタム ニューラル モデルのトレーニング 1 か月あたり 10 1 か月あたり 20
調整可能 いいえ はい 3
ページの最大数 (トレーニング) * 分類子 10,000 10,000 (既定値)
調整可能 いいえ いいえ
ドキュメントの種類 (クラス) の最大数 * 分類子 500 500 (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ * 分類子 1GB 1GB (既定値)
調整可能 いいえ いいえ
クラスあたりの最小サンプル数 * 分類子 5 5 (既定値)
調整可能 いいえ いいえ

カスタム モデルの制限

Quota Free (F0) 1 Standard (S0)
Compose モデルの制限 5 200 (既定値)
調整可能 いいえ いいえ
トレーニング データセット サイズ 50 MB 50 MB (既定値)
調整可能 いいえ いいえ
ページの最大数 (トレーニング) 500 500 (既定値)
調整可能 いいえ いいえ

1Free (F0) 価格レベルについては、価格ページで月額料金も参照してください。
2ベスト プラクティスおよび調整手順を参照してください。
3 ニューラル モデルのトレーニング数は、暦月ごとにリセットされます。 サポート リクエストを提出し、毎月のトレーニング制限を引き上げます。 v4.0 API 以降、カレンダー月内でトレーニング要求が 20 件を超える場合は、トレーニング レベルで課金されます。 詳細については、価格のページを参照してください。

4 この制限は、ラベル付け関連の更新の前にトレーニング データセット フォルダー内で見つかるすべてのドキュメントに適用されます。

5 この制限は、v 4.0 (2024-11-30 GA) カスタム ニューラル モデルにのみ適用されます。 v 4.0以降、大規模なドキュメントのトレーニングがより長期間サポートされます (最大 10 時間無料。その後に料金が発生します)。 詳細については、カスタム ニューラル モデルのページを参照してください。

詳細な説明、クォータの調整、およびベスト プラクティス

サポート チケットを提出して増加を要求すると、既定の制限を引き上げることができます。 クォータの引き上げを要求する前に (該当する場合)、それが必要であることを確認します。 Document Intelligence サービスでは、自動スケーリングを用いて必要なコンピューティング リソース on-demand を提供し、顧客のコストを低く抑え、過剰なハードウェア容量を維持しないようにして未使用のリソースをプロビジョニング解除します。

アプリケーションから応答コード 429 ("要求数が多すぎます") が返された場合、次のいずれかまたは複数の 1 秒あたりのトランザクション数制限 (TPS) のしきい値を超えています。

  • 1 秒あたりの分析トランザクション数の制限 分析要求の送信 (POST) に関する TPS
  • 1 秒あたりの Get 操作数の制限 分析操作の結果のポーリング (GET) に関する TPS
  • 1 秒あたりのモデル管理操作数の制限 ビルド/トレーニングやコピーなどのモデル管理に関連する操作数。
  • 1 秒あたりの List 操作数の制限 モデルや操作の一覧表示に関連する操作数。

自動スケーリング時のスロットリングを緩和するための一般的なベスト プラクティス

スロットリングに関連する問題 (応答コード 429) を最小限に抑えるには、次の手法を使用することをお勧めします。

  • アプリケーションで再試行ロジックを実装します。
  • ワークロードが急激に変化しないようにします。 ワークロードは徐々に増やします
    例。 アプリケーションで Document Intelligence が使用されており、現在のワークロードは 10 TPS (1 秒あたりのトランザクション数) です。 次の 1 秒間で、負荷を 40 TPS に増やしたとします。 その結果、分析操作の送信に関する TPS 制限の 15 を超えるため、一部の要求に対して応答コード 429 が返されます。 処理をバックオフして 15 TPS 未満に抑えるか、より多くのトランザクションをサポートするために TPS の引き上げを要求できます。

次のセクションでは、クォータを調整する特定のケースについて説明します。 Document Intelligence: 同時要求の制限を引き上げる方法に移動

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

既定では、1 秒あたりのトランザクション数は、Document Intelligence リソースに対して 1 秒あたり 15 トランザクションに制限されます。 Standard 価格レベルでは、この数を増やすことができます。 要求を送信する前に、こちらのセクションの資料について理解していること、およびこれらのベスト プラクティスを把握していることを確認してください。

最初の手順は、自動スケーリングを有効にすることです。 このドキュメントに従って、リソースの自動スケーリングを有効にします * 自動スケーリングを有効にする。 自動スケーリングを有効にすると、サービスに容量がある場合、リソースで、構成された TPS 制限を超えて要求を受け入れ続けることができます。 その場合でも、要求が調整される可能性があります。

同時要求の上限を上げても、コストに直接影響することはありません。 Document Intelligence サービスでは、"使用した分だけ支払う" モデルを使用しています。 この制限によって、要求のスロットリングが開始される前に、サービスをどの程度スケーリングできるかが定義されます。

さまざまな要求制限カテゴリの既定値は、Azure portal を使用して、リソースの [概要] ブレードにある [監視] タブで確認できます。

TPS を引き上げるためにサポート リクエストを作成して送信する

サポート リクエストを送信して、リソースの 1 秒あたりのトランザクション数 (TPS) の制限を引き上げる手順を開始します。

  • Azure ポータル
  • TPS の上限を引き上げる Document Intelligence リソースを選択します
  • [新しいサポート リクエスト] ([サポート + トラブルシューティング] グループ) を選択します。 Azure サブスクリプションと Azure リソースに関する情報が自動的に入力された新しいウィンドウが表示されます
  • [概要] を入力します (「Document Intelligence TPS の上限を引き上げる」など)
  • 問題の種類フィールドに [クォータまたは使用状況の検証] を選択します。
  • [次へ: ソリューション] を選択します。
  • 要求の作成を進めます
  • [詳細] フィールドで、[説明] フィールドに次の情報を入力します。
    • 要求が Document Intelligence クォータに関するものであることを示すメモ。
    • TPS に関して希望するスケーリングの目標値を指定 TPS の引き上げは無料ですが、お使いのワークロードに妥当な TPS のみを要求する必要があります。
    • Azure リソース情報
    • 必要な情報を入力して、[確認と作成] タブの [作成] ボタンを選択します。
    • Azure portal 通知のサポート リクエスト番号をメモしておきます。 [サポート] を探して、この後の処理について確認します。

ワークロード パターンの例のベスト プラクティス

この例では、自動スケーリングが進行中であることによって発生する可能性がある要求のスロットリングを軽減するために、次のようなアプローチを推奨しています。 これは「正確なレシピ」ではなく、必要に応じて従い、調整するテンプレートにすぎません。

Document Intelligence リソースに既定の制限が設定されているとします。 ワークロードを開始して、分析要求を送信します。 完了を確認すると、応答コード 429 が返され、要求調整が頻繁に発生していることがわかった場合は、まず GET 分析応答要求にエクスポネンシャル バックオフを実装します。 連続するエラー応答の再試行間で待機時間を徐々に長くします。たとえば、リクエスト間の遅延パターンを 2-5-13-34 にします。 一般に、対応する POST 要求に対して 2 秒に 1 回以上応答分析取得を呼び出さないことをお勧めします。 analyze 応答には、retry-after ヘッダーも含まれます。これは、その要求の完了を確認するまでに待機する必要がある秒数を示します。

送信されるドキュメントの POST 要求の数が調整されていることがわかった場合は、要求間に遅延を追加することを検討してください。 ワークロードでより高度な同時処理が必要な場合は、サポート リクエストを作成して、1 秒あたりのトランザクションのサービス制限を引き上げる必要があります。

一般に、運用環境に移行する前にワークロードとワークロード パターンをテストしておくことをお勧めします。

次のステップ