編集

次の方法で共有


よく寄せられる質問

このコンテンツの適用対象: checkmark v4.0 (プレビュー) checkmark v3.1 (GA) checkmark v3.0 (GA) checkmark v2.1 (GA)

Azure AI Document Intelligence は、機械学習モデルを使用してドキュメントからキーと値のペア、テキスト、テーブルを抽出するクラウド ベースのサービスです。 返される結果は、構造化された JSON 出力です。 Document Intelligence のユース ケースには、自動データ処理、強化されたデータ ドリブン戦略、エンリッチされたドキュメント検索機能が含まれます。

概要

Azure AI Document Intelligence と Azure AI Form Recognizer は同じサービスですか?

はい。

Azure AI Document Intelligence と Azure AI Form Recognizer は同じサービスです。 このサービスの名前は、2023 年 7 月に Azure AI Form Recognizer から Azure AI Document Intelligence に変更されました。 このサービスは、名前の変更前と同じ機能を提供します。

  • 価格の変更: 価格に変更はありません。 Cognitive Services と Applied AI Services の名前は、引き続き Azure の課金、コスト分析、価格表、価格 API で使用されます。

  • 破壊的変更: API またはクライアント ライブラリへの破壊的変更はありません。 REST API と SDK バージョン 2024-02-29-preview、2023-10-31-preview 以降は document intelligence と名前が変更されます。

Document Intelligence は他の Microsoft サービスと統合されますか?

はい。

Document Intelligence は、次のサービスと統合されています。

AI 機能

ドキュメント処理のために Document Intelligence を生成 AI と組み合わせて使用できますか?

はい。

Document Intelligence には、生成 AI と大規模言語モデル (LLM) を使ってドキュメントからフィールドを抽出する新しい種類の抽出モデルであるカスタム生成が含まれるようになりました。 以前は、フィールドを抽出するには RAG (取得拡張生成) パターンを使っていました。 新しいモデルでは、1 回の API 呼び出しで高品質の結果が得られます。 また、ドキュメント生成 AI ソリューションを使うと、ドキュメントとチャットしたり (RAG)、それらのドキュメントから魅力的なコンテンツを生成したり、データの Azure OpenAI Service モデルにアクセスしたりできます。

  • Azure AI Document Intelligence と Azure OpenAI を組み合わせると、自然言語を使ってドキュメントをシームレスに操作するエンタープライズ アプリケーションを構築できます。 簡単に回答を見つけ、貴重な洞察を得て、既存のドキュメントから新しい魅力的なコンテンツを生成できます。

  • 詳細については、こちらの取得拡張生成パターンを参照してください。

Document Intelligence は、取得拡張生成のためのドキュメントのセマンティック チャンキングに役立ちますか?

はい。

Document Intelligence によって、セマンティック チャンキングを有効にする基礎的要素が提供されます。 セマンティック チャンキングは、コンテキスト密度の高いチャンクと関連性の向上を実現するための、取得拡張生成 (RAG) の重要なステップです。

  • Document Intelligence は、ドキュメントを行、段落、セクション、ヘッダー、フッターに視覚的に分解するレイアウト モデルを提供します。

  • その後、マークダウン形式で結果を取得し、セクションまたは段落の境界でドキュメントをさらにチャンクすることができます。

詳細については、Document Intelligence での RAG の概要に関する記事を参照してください

Document Intelligence Studio

Document Intelligence Studio にアクセスするには特定のアクセス許可が必要ですか?

はい。

Document Intelligence Studio にアクセスするには、少なくとも閲覧者ロールを持つアクティブな Azure アカウントとサブスクリプションが必要です。

ドキュメント分析および事前構築済みモデルの場合のユーザー シナリオのためのロール要件を次に示します。

  • 基本

  • 上級

    • 共同作成者: リソース グループまたは Document Intelligence リソースを作成するには、このロールが必要です。

カスタム モデル プロジェクトの場合のユーザー シナリオのためのロール要件を次に示します。

  • 基本

    • Cognitive Services ユーザー: Document Intelligence または Cognitive Services マルチサービス リソースでカスタム モデルをトレーニングしたり、トレーニング済みモデルを使用して分析したりするには、このロールが必要です。

    • ストレージ BLOB データ共同作成者: ストレージ アカウントでプロジェクトおよびラベル データを作成するには、このロールが必要です。

  • 上級

    • ストレージ アカウント共同作成者: ストレージ アカウントでクロス オリジン リソース共有 (CORS) 設定を設定するには、このロールが必要です。 同じストレージ アカウントを再利用する場合、これは 1 回限りの作業です。

    • 共同作成者: リソース グループとリソースを作成するには、このロールが必要です。 共同作成者またはストレージ アカウント共同作成者ロールでは、ローカル (キーベース) 認証が無効になっている場合、Document Intelligence リソースまたはストレージ アカウントを使用するためのアクセス権は付与されません。 Document Intelligence Studio で関数を使用するには、基本的なロール (Cognitive Services ユーザーストレージ データ BLOB 共同作成者) が引き続き必要です。

詳細については、Microsoft Entra 組み込みロールに関するページ、および Document Intelligence Studio クイックスタートの Azure ロールの割り当てに関するセクションを参照してください。

Document Intelligence Studio で 2 ページを超えるドキュメントを処理できますか?

はい (有料レベルのリソースの場合)。

いいえ (無料レベルのリソースの場合)。

  • 無料レベル (F0) のリソースの場合は、Document Intelligence Studio、REST API、クライアント ライブラリのいずれを使用しているかにかかわらず、最初の 2 ページだけが分析されます。

  • ドキュメント内のすべてのページを分析する場合は、有料の (S0) リソースに変更してください。 Document Intelligence Studio で、[設定] (歯車) ボタンを選択し、[リソース] タブを選択して、ドキュメントを分析するために使用している価格帯を確認します。

Document Intelligence Studio でディレクトリまたはサブスクリプションを切り替えることができますか?

はい。

  • Document Intelligence Studio でディレクトリを変更するには、[設定] (歯車) ボタンを選択します。 [ディレクトリ] で、一覧からディレクトリを選択してから [ディレクトリの切り替え] を選択します。 ディレクトリを切り替えた後に、もう一度サインインします。

  • サブスクリプションまたはリソースを変更するには、[設定] の下にある [リソース] タブに移動します。

ファイアウォールまたは仮想ネットワークを使用して構成されているリソースで Document Intelligence Studio を使用できますか?

はい。

Document Intelligence リソースがファイアウォールまたは仮想ネットワークを使用して構成されている場合は、Document Intelligence リソースのファイアウォール許可リストに専用 IP アドレス 20.3.165.95 を追加する必要があります。 パブリック ネットワーク アクセスが無効になっている場合、カスタム プロジェクトの一部の関数 (自動ラベル、プロジェクト マネジメント、人間の関与など) は機能しません。

Document Intelligence Studio で "URL からフェッチ" 関数を使用してファイルをアップロードする場合、BLOB ストレージの URL を使用できますか?

はい。

Azure BLOB ストレージの URL に SAS トークンが含まれており、パブリック ネットワークからアクセスできる場合は可能です。 キー アクセスが無効になっているストレージ アカウントやファイアウォール/VNet の背後にあるストレージ アカウントには、Fetch 関数を使用できません。

Document Intelligence Studio のラベル付けエクスペリエンスを再利用またはカスタマイズし、それを独自のアプリケーション内に構築できますか?

はい。

Document Intelligence Studio のラベル付けエクスペリエンスは、Toolkit リポジトリでオープン ソース化されています。

Document Intelligence のソブリン クラウド リージョン用の独立した URL エンドポイントがありますか?

はい。

Document Intelligence Studio には、ソブリン クラウド リージョン用の独立した URL エンドポイントがあります。

アプリ開発

Azure AI Document Intelligence で最新の開発オプションを使用してアプリケーションを開発できますか?

はい。

Document Intelligence は、次のプラットフォーム内で最新の開発オプションを提供します。

アプリケーションを最新バージョンの Document Intelligence に移行できますか?

はい。

次の表に、最新バージョンの Document Intelligence に移行するための詳細な手順へのリンクを示します。

言語/API 移行ガイド
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

ドキュメント内で分析するページの範囲を指定できますか?

はい。

pages パラメーター (v2.1、v3.0、およびそれ以降のバージョンの REST API でサポートされています) を使用し、複数ページの PDF および TIFF ドキュメントのページを指定します。 受け入れられる入力には、次の範囲が含まれます。

  • 単一ページ。 たとえば、1, 2 を指定した場合は、ページ 1 と 2 が処理されます。
  • 有限の範囲。 たとえば、2-5 を指定した場合は、ページ 2 から 5 が処理されます。
  • オープンエンドの範囲。 たとえば、5- を指定した場合は、ページ 5 からのすべてのページが処理されます。 -10 を指定した場合は、ページ 1 から 10 が処理されます。

これらのパラメーターは混在させることができ、範囲も重複させることができます。 たとえば、-5, 1, 3, 5-10 を指定した場合は、ページ 1 から 10 が処理されます。

サービスは、ドキュメントの少なくとも 1 ページが処理できる場合、要求を受け入れます。 たとえば、5 ページのドキュメントでの 5-100 の使用は有効な入力です。つまり、ページ 5 が処理されます。

ページ範囲を指定しない場合は、ドキュメント全体が処理されます。

プロジェクトに FOTT サンプル ラベル付けツールではなく、Document Intelligence Studio を使用することを推奨しますか?

はい。

ほとんどの場合、Document Intelligence Studio をお勧めします。これを使用すると、Document Intelligence リソースやストレージ サービスを構成するための時間を短縮できるためです。

次のシナリオの場合にのみ、フォーム テスト ツール (FOTT) の使用を検討してください。

調整を軽減するためのベスト プラクティスはありますか?

はい。

Document Intelligence では、自動スケーリングを使用して、お客様のコストを低く維持しながら必要なコンピューティング リソースをオンデマンドで提供します。 自動スケール中のスロットリングを軽減するために、次の方法をお勧めします。

  • アプリケーションで再試行ロジックを実装します。

  • POST 要求の数で調整されていることがわかった場合は、要求の間に遅延を追加することを検討してください。

  • ワークロードは徐々に増やします。 急激に変化しないようにします。

  • 1 秒あたりのトランザクション数 (TPS) の制限を増やすためのサポート リクエストを作成します。

Document Intelligence のサービスのクォータと制限について説明します。

カスタム モデル

カスタム モデルの推定精度スコアを改善できますか?

はい。

ドキュメントの視覚的構造の差異が、モデルの正確性に影響を与える場合があります。 いくつかのヒントを次に示します。

  • トレーニング データセットにドキュメントのすべての差異を含めます。 差異には形式の違い (デジタル PDF とスキャンされた PDF など) が含まれます。

  • 視覚的な違いが明らかである種類ごとにドキュメントを分離し、さまざまなモデルをトレーニングします。

  • 余分なラベルがないことを確認します。

  • 署名と領域のラベル付けに関しては、周囲のテキストを含めないでください。

詳細については、正確性スコアと信頼度スコアに関するページを参照してください。

カスタム モデルを再トレーニングできますか?

いいえ。

  • Document Intelligence に明示的な再トレーニング操作はありません。 トレーニング操作のたびに新しいモデルが生成されます。

  • モデルに再トレーニングが必要なことがわかった場合は、トレーニング データセットにさらに多くのサンプルを追加して、新しいモデルをトレーニングできます。

  • 次のように、元のモデルを使用して作成する新しいモデルを作成することもできます。

    1. 新しいテンプレートのためのデータセットを作成します。

    2. 新しいモデルのラベル付けとトレーニングを行います。

    3. 特定のドキュメントの種類に対して新しいモデルのパフォーマンスが良好であることを検証します。

    4. この新しいモデルと既存のモデルから、1 つのエンドポイントを作成します。 これで、Document Intelligence が、分析する各ドキュメントに最適なモデルを決定できます。

    詳細については、作成済みモデルに関する記事を参照してください。

トレーニング済みのモデルを、ある環境 (ベータ版など) から別の環境 (本番環境など) に移動できますか?

はい。

コピー API を使用して、ある Document Intelligence アカウントから、サポートされているいずれかの地理的リージョンに存在する他のアカウントにカスタム モデルをコピーできます。 詳細な手順については、「ディザスター リカバリー」を参照してください。

このコピー操作は、そのモデルをトレーニングした特定のクラウド環境内でのモデルのコピーに制限されます。 たとえば、パブリック クラウドから Azure Government クラウドへのモデルのコピーはサポートされていません。

カスタム モデルをトレーニングする場合、料金はかかりますか?

はい。

トレーニングは、すべてのカスタム生成およびカスタム テンプレート モデルに対して無料です。 ただし、すべてのモデルのトレーニング データセットを作成するには、トレーニング ドキュメントでレイアウト モデルを実行する必要があります。 このコストはお客様が支払う必要があります。

カスタム生成モデルは、ラベル付けされたデータセットの生成を速くするため、自動ラベル機能にも依存します。 このアクションにはコストがかかります。 テンプレート モデルと生成モデルの構築操作は無料ですが、ラベル付けされたデータセットを作成すると、最小限のコストがかかることがあります。

v4.0 2024-07-31-preview の場合、カスタム ニューラル モデルは最大 10 時間無料でトレーニングできます。 10 時間で 1 つのモデルをトレーニングする場合でも、複数のモデルを合計 10 時間でトレーニングする場合でも、最初の 10 時間は無料です。 無料の 10 時間を使い切った後、追加のトレーニング時間には、自動的に請求されます。 価格の詳細については、価格に関するページを参照してください。 この新しい有料トレーニング機能を使用すると、モデルのトレーニング期間を延長して、より大きなドキュメントを処理できます。 この有料トレーニング機能の詳細については、カスタム ニューラル モデルの「請求」セクションを参照してください。

v3.0 2022-08-31 または v3.1 2023-07-31 の場合、カスタム ニューラル モデルは最大 20 のトレーニング セッションを無料でトレーニングでき、各セッションのトレーニング期間の上限は 30 分間です。 20 個のトレーニング セッションをすべて使い切ったら、Azure サポート チケットを送信してトレーニング セッションの制限を延長することができます。 この制限を引き上げるには、2 つのトレーニング セッションが 1 つのトレーニング時間と見なされ、2 つのセッション (1 つのトレーニング時間) ごとに課金されます。 価格の詳細については、[価格ページ]を参照してください。 制限を引き上げる方法の詳細については、カスタム ニューラル モデルの「請求」セクションを参照してください。 v3.0v3.1 の場合、有料トレーニング機能は使用できません。 カスタム ニューラル モデルの有料トレーニング機能は、v4.0 でのみ使用できます。

ストレージ アカウント

ストレージ アカウント認証に使用する Shared Access Signature (SAS) トークンに有効期限はありますか?

はい。

共有アクセス署名 (SAS) を作成するとき、既定の有効期間は 48 時間です。 48 時間後に、新しいトークンを作成する必要があります。

Document Intelligence でストレージ アカウントを使用している時間に対してより長い期間を設定することを検討してください。

ストレージ アカウントが仮想ネットワークまたはファイアウォールの背後に位置する場合、Document Intelligence はデータにアクセスできますか?

いいえ、直接にはできません。

ストレージ アカウントが仮想ネットワークまたはファイアウォールによって保護されている場合は、Document Intelligence からそのストレージ アカウントに直接アクセスできません。

ただし、プライベート Azure ストレージ アカウントのアクセスと認証では、Azure リソース用マネージド IDがサポートされます。 マネージド ID を使用している場合、Document Intelligence サービスでは、割り当てられている資格情報を使用してストレージ アカウントにアクセスできます。

FOTT を使用してプライベート ストレージ アカウント データを分析しようとする場合は、仮想ネットワークまたはファイアウォールの背後にツールをデプロイする必要があります。

Document Intelligence リソース用のマネージド ID を作成して使用する方法を説明します。

Containers

切断されたコンテナーと接続されたコンテナーに違いはありますか?

はい。

接続されたコンテナーと切断されたコンテナーのモデル機能は同じですが、課金方法と接続方法は異なります。

  • 接続されたコンテナーは、Azure アカウント上の Document Intelligence リソースを使用して課金情報を Azure に送信します。 接続されたコンテナーでは、課金情報を Azure に送信するためにインターネット接続が必要です。 Document Intelligence に接続されたコンテナーは、Azure アカウントの Document Intelligence リソースを使用して Azure に課金情報を送信します。 接続されたコンテナーによって、お客様のデータ (解析対象の画像やテキストなど) が Microsoft に送信されることはありません。 接続されたコンテナーが課金のために Microsoft に送信する情報の例については、Azure AI コンテナーに関する FAQ を参照してください。

  • 切断されたコンテナーを使用すると、インターネットから切断された API を使用できます。 課金情報は、インターネット経由で送信されません。 代わりに、購入されているコミットメント レベルに基づいて課金されます。 現在、切断されたコンテナーの使用は、Document Intelligence のカスタムと請求書のモデルで利用できます。

Document Intelligence サンプル ラベル付けツール (FOTT) のコンテナーにローカル ストレージを使用できますか?

はい。

FOTT には、ローカル ストレージを使うバージョンがあります。 このバージョンは、Windows コンピューターにインストールする必要があります。 この場所からそれをインストールできます。

ラベル付けファイルがサブディレクトリにある場合は、プロジェクト ページで、ラベル フォルダーの URI を /shared または /shared/sub-dir として指定します。 Document Intelligence サンプル ラベル付けツールのその他の動作はすべて、ホストされているサービスと同じです。

スケールアップのためのベスト プラクティスはありますか?

はい。

非同期呼び出しの場合は、共有ストレージを使用して複数のコンテナーを実行できます。 POST 分析呼び出しを処理しているコンテナーは、出力をストレージに格納します。 その後、他のコンテナーがストレージから結果をフェッチし、GET 呼び出しを実行できるようになります。 要求 ID はコンテナーに関連付けられません。

同期呼び出しの場合は、複数のコンテナーを実行できますが、要求を処理するのは 1 つのコンテナーだけです。 これはブロック呼び出しであるため、プールのすべてのコンテナーが要求を処理し、応答を送信できます。 ここでは、一度に 1 つのコンテナーだけが要求に関連付けられるため、ポーリングは必要ありません。

共有ストレージを使ってコンテナーを設定できますか?

はい。

コンテナーでは、処理ファイルを格納する共有ストレージを指定するために、起動中に Mounts: Shared プロパティを使用します。 このプロパティの使用を確認するには、コンテナーのドキュメントを参照してください。

セキュリティとプライバシー

Document Intelligence は自分のデータを格納しますか?

はい、短時間保存します。

すべての機能について、Document Intelligence では、データと結果を要求と同じリージョン内の Azure Storage に一時的に格納します。 その後、データは分析要求が送信された時刻から 24 時間以内に削除されます。

Document Intelligence のデータ、プライバシー、セキュリティに関する詳細を確認してください。

トレーニング済みカスタム モデルの場合、分析とラベル付けの後の中間出力は、トレーニング データを保存するのと同じ Azure Storage の場所に保存されます。 トレーニング済みカスタム モデルは同じリージョン内の Azure Storage に保存され、Azure サブスクリプションと API 資格情報を使用して論理的に分離されます。

その他のヘルプとサポート

Azure AI Document Intelligence に関する質問に対する解決策を提供するために使用できるリソースはほかにありますか?

はい。

Microsoft Q & A は、Microsoft の技術に関する質問と回答のホームです。 Document Intelligence に固有のクエリをフィルター処理できます。

ドキュメントにラベル付けしているときに、サービスが特定のテキストを認識しないか、誤って認識する場合、フィードバックを直接提供できますか?

はい。

Document Intelligence モデルは、継続的に更新および改善されています。 Document Intelligence チームにメールを送信できます。 可能であれば、問題箇所を強調したサンプル ドキュメントを添付してください。