次の方法で共有


Azure AI Document Intelligence とは?

このコンテンツの適用対象: checkmark v4.0 (GA) | 以前のバージョン: 青のチェックマーク v3.1 (GA) 青のチェックマーク v3.0 (GA) 青のチェックマーク v2.1 (GA)

このコンテンツの適用対象: checkmark v3.1 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (GA) | 以前のバージョン: 青のチェックマーク v3.0 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v3.0 (GA) | 最新バージョン: 紫のチェックマーク v4.0 (GA) 紫のチェックマーク v3.1 | 以前のバージョン: 青のチェックマーク v2.1

このコンテンツの適用対象: checkmark v2.1 | 最新バージョン: 青のチェックマーク v4.0 (GA)

Azure AI Document Intelligence は、クラウドベースの Azure AI サービスで、インテリジェントなドキュメント処理ソリューションの構築を可能とします。 さまざまなデータ型にまたがる大量のデータが、フォームとドキュメントに格納されます。 Document Intelligence は、データの収集と処理の速度を効果的に管理することを可能とし、運用の改善、情報に基づくデータ主導の意思決定、知見に基づくイノベーションの鍵となります。

|✔️ ドキュメント分析モデル |✔️ 事前構築済みモデル |✔️ カスタム モデル |

汎用抽出モデル

汎用抽出モデルを使用すると、フォームやドキュメントからテキストを抽出し、組織でのアクション、運用、開発などに利用できる、構造化されたビジネス対応コンテンツを返すことができます。

読み取り | 印刷されたテキストや手書きテキストを抽出します。

レイアウト | テキスト、テーブル、ドキュメントの構造を抽出します。

読み取り | 印刷されたテキスト
や手書きテキストを抽出します。

レイアウト | テキスト、テーブル、
ドキュメントの構造を抽出します。

一般的なドキュメント | テキスト、
構造、キーと値のペアを抽出します。

事前構築済みのモデル

事前構築済みモデルを使用して、独自モデルのトレーニングや構築をしなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。

口座取引明細書 | 口座取引明細書から口座情報と詳細を抽出します。

小切手 | 小切手から関連情報を抽出します。

契約 | 契約と関係者の詳細を抽出します。

クレジット カード | 決済カード情報を抽出します。

請求書 | 顧客とベンダーの詳細を抽出します。

給与明細 | 給与明細の詳細を抽出します。

領収書 | 販売 トランザクションの詳細を抽出します。

米国税

米国統一税 | サポートされている米国税フォームから抽出します。

米国税 W-2 | 課税対象の報酬の詳細を抽出します。

米国税 1098 | 1098 バリエーションの詳細を抽出します。

米国税 1099 | 1099 バリエーションの詳細を抽出します。

米国税 1040 | 1040 バリエーションの詳細を抽出します。

米国住宅ローン

米国住宅ローン 1003 | ローン申請の詳細を抽出します。

米国住宅ローン 1004 | 評価から情報を抽出します。

米国住宅ローン 1005 | 在籍証明書から情報を抽出します。

米国住宅ローン 1008 | ローン転送の詳細を抽出します。

米国住宅ローン開示 | 最終的なローンのクロージング条件を抽出します。

個人識別

健康保険証 | 保険のカバレッジ詳細を抽出します。

ID | 検証の詳細を抽出します。

結婚証明書 | 認定された結婚情報を抽出します。

請求書 | 顧客
とベンダーの詳細を抽出します。

領収書 | 販売
トランザクションの詳細を抽出します。

ID | 識別
と検証の詳細を抽出します。

健康保険証 | 健康保険の詳細を抽出します。

名刺 | ビジネス用の連絡先の詳細を抽出します。

契約 |契約
とパーティーの詳細を抽出します。

米国税 W-2 | 課税対象の
報酬の詳細を抽出します。

米国税 1098 | 1098 バリエーションの詳細を抽出します。

カスタム モデル

カスタム モデルは、ラベル付きデータセットを使用してトレーニングされ、ユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 スタンドアロンのカスタム モデルを組み合わせて、作成済みモデルを作成できます。

ドキュメント フィールド抽出モデル

✔️ ドキュメント フィールド抽出モデルをトレーニングして、ドキュメントからラベル付きフィールドを抽出します。

カスタム ニューラル | 混在型ドキュメントからデータを抽出します。

カスタム テンプレート | 静的レイアウトからデータを抽出します。

カスタム構成 | モデルのコレクションを使用してデータを抽出します。

カスタム分類モデル

✔️ カスタム分類器は、抽出モデルを呼び出す前に、ドキュメントの種類を特定します。

カスタム分類器 | 抽出モデルを呼び出す前に、指定されたドキュメントの種類 (クラス) を特定します。

アドオン機能

Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできるオプションの機能がサポートされています。

分析機能

モデル ID テキストの抽出 クエリ フィールド 段落 段落の役割 選択マーク テーブル キーと値のペア 言語 バーコード ドキュメント分析 数式* スタイルのフォント* 高解像度* 検索可能な PDF
prebuilt-read O O O O O O
事前構築済みレイアウト O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (各種) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (各種) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - 有効
O - 省略可能
* - 追加コストが発生する Premium 機能

モデルと開発のオプション

注意

以下のドキュメント解釈モデルと開発オプションは Document Intelligence サービス v3.0 でサポートされています。

Document Intelligence を使用して、アプリケーションとワークフローでのドキュメント処理を自動化し、データ主導戦略を強化し、ドキュメント検索機能を強化することができます。 表のリンクから、各モデルの詳細や開発のオプションを参照できます。

Read

Document Intelligence Studio を使用した読み取りモデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-read ● 文書からテキストを抽出します。
データ抽出
● 文書をデジタル化します。
● コンプライアンスと監査。
● 手書きのメモの翻訳前の処理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

レイアウト

Document Intelligence Studio を使用したレイアウト モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
事前構築済みレイアウト ● 文書からテキストおよびレイアウト情報を抽出します。
データ抽出
● 構造によるドキュメントのインデックス作成と取得。
● 財務および医療レポートの分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

一般的なドキュメント (2023-10-31 プレビューで非推奨)

Document Intelligence Studio を使用した一般ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
事前構築済みドキュメント ● ドキュメントからテキスト、レイアウト、キーと値のペアを抽出します。
データとフィールドの抽出
● キーと値のペアの抽出。
● フォーム処理。
● 調査データの収集と解析。
Document Intelligence Studio
REST API

請求書

Document Intelligence Studio を使用した請求書モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-invoice ● 請求書から主要な情報を抽出します。
データとフィールドの抽出
● 買掛金勘定処理。
● 自動的な税の記録とレポート。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Receipt

Document Intelligence Studio を使用した領収書モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-receipt ● レシートから主要な情報を抽出します。
データとフィールドの抽出
● 領収書モデル v3.0 では、単一ページのホテル領収書の処理がサポートされています。
● 経費管理。
● コンシューマーの行動データ分析。
● 顧客ロイヤルティ プログラム。
● 商品返品処理。
● 自動的な税の記録とレポート。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

アイデンティティ (ID)

Document Intelligence Studio を使用した ID ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-idDocument ● パスポートや ID カードから主要な情報を抽出します。
ドキュメントの種類
● 米国の運転免許証から保証、制限、車両分類を抽出します。
● Know Your Customer (KYC) 金融サービス ガイドラインのコンプライアンス。
● 医療アカウント管理。
ID チェックポイントとゲートウェイ。
● ホテルの登録。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

チェック

Document Intelligence Studio を使用した小切手モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-check ● 小切手から主要な情報を抽出します。
データとフィールドの抽出
● クレジット管理。
● 自動貸し手管理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

給与明細

Document Intelligence Studio を使用した給与明細モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-paystub ● 給与明細から主要な情報を抽出します。
データとフィールドの抽出
● 従業員給与支払い名簿の詳細の確認。
● 雇用に関する不正行為の検出。
● 自動税処理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

口座取引明細書

Document Intelligence Studio を使用した口座取引明細書モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-bankStatement ● 口座取引明細書から主要な情報を抽出します。
データとフィールドの抽出
● 税処理のユース ケース。
● 自動会計管理。
● クレジット/デビット管理。
● ローン ドキュメント処理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

医療保険カード

Document Intelligence Studio を使用した医療保険カード モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-healthInsuranceCard.us ● 米国の健康保険カードから主要な情報を抽出します。
データとフィールドの抽出
● カバレッジと適格性の検証。
● 予測モデリング。
● 価値ベースの分析。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

コントラクト モデル

Document Intelligence Studio を使用した契約書モデル抽出のスクリーンショット。

モデル ID 説明 開発オプション
事前構築済みコントラクト 契約同意書と関係者の詳細を抽出します。
データおよびフィールドの抽出
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

クレジット カード モデル

Document Intelligence Studio を使用したクレジット カード イメージ モデル分析のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-creditCard 契約書とパーティーの詳細を抽出します。
データおよびフィールドの抽出
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

結婚証明書モデル

Document Intelligence Studio を使用した結婚証明書ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-marriageCertificate.us 契約書とパーティーの詳細を抽出します。
データおよびフィールドの抽出
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1003 のフォーム

Document Intelligence Studio を使用した米国住宅ローン 1003 ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1003 1003 ローン申請から主要な情報を抽出します。
データおよびフィールドの抽出
● Fannie Mae と Freddie Mac のドキュメント要件。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1004 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1004 ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1004 1004 評価から主要な情報を抽出します。
データおよびフィールドの抽出
● Fannie Mae と Freddie Mac のドキュメント要件。
● 対象資産の市場価値で貸し手/顧客に役立つ統一住宅評価報告書。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1005 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1005 ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1005 1005 在籍証明書から主要な情報を抽出します。
データおよびフィールドの抽出
● Fannie Mae と Freddie Mac のドキュメント要件。
● 見込み抵当権設定者としての資格を判別するための雇用書類の検証。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1008 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1008 ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1008 ● 統一された引受と送付状の概要から重要な情報を抽出します。
データおよびフィールドの抽出
● 集計データを使用したローン引受処理。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン開示フォーム

Document Intelligence Studio を使用した米国住宅ローン決算開示ドキュメント モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.closingDisclosure ● 統一された引受と送付状の概要から重要な情報を抽出します。
データおよびフィールドの抽出
● 住宅ローン最終詳細の要件。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 W-2 モデル

Document Intelligence Studio を使用した W-2 モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
prebuilt-tax.us.W-2 ● IRS US W2 税フォーム (2018 年~2021 年) から主要な情報を抽出します。
● 自動化された税ドキュメントの管理。
● 住宅ローンの申し込み処理。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1098 (およびバリエーション) フォーム

Document Intelligence Studio で分析した米国 1098 納税様式のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1098{variation} ● 1098 フォームのバリエーションから主要な情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1099 (およびバリエーション) フォーム

Document Intelligence Studio で分析した米国 1099 納税様式のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1099{variation} ● 1099 フォームのバリエーションから情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1040 (およびバリエーション) フォーム

Document Intelligence Studio を使用した米国税 1040 税フォーム モデル分析のスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1040{variation} ● 1040 フォームのバリエーションから情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国統一税フォーム

モデル ID 説明 開発オプション
prebuilt-tax.us ●サポートされているいずれかの米国税フォームから情報を抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

名刺

Document Intelligence Studio を使用した名刺モデル分析のスクリーンショット。

モデル ID 説明 自動化のユース ケース 開発オプション
事前構築された名刺 ● 名刺から主要な情報を抽出します。
データとフィールドの抽出
● リードとマーケティングの管理。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

カスタム モデルの概要

Document Intelligence Studio を使用したカスタム モデル トレーニングのスクリーンショット。

詳細 説明 自動化のユース ケース 開発オプション
カスタム モデル 一連の代表的なトレーニング ドキュメントのセットから作成されたモデルに基づいて、フォームとドキュメントから構造化データとして情報を抽出します。 ビジネスやユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム ニューラル

Document Intelligence Studio を使用したカスタム ニューラル モデル分析のスクリーンショット。

注意

カスタム ニューラル モデルをトレーニングするには、buildMode プロパティを neural に設定します。 詳細については、「ニューラル モデルのトレーニング」を参照してください。

バージョン情報 説明 自動化のユース ケース 開発オプション
カスタム ニューラル モデル カスタム ニューラル モデルを使用して、構造化されたドキュメント (アンケート、調査)、半構造化されたドキュメント (請求書、発注書)、構造化されていないドキュメント (契約書、レター) からラベル付けされたデータを抽出します。 構造化されたドキュメントと構造化されていないドキュメントから、テキスト データ、チェックボックス、表形式フィールドを抽出します。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム テンプレート

Document Intelligence Studio を使用したカスタム テンプレート モデル分析のスクリーンショット。

注意

カスタム テンプレート モデルをトレーニングするには、buildMode プロパティを template に設定します。 詳細については、「テンプレート モデルのトレーニング」を参照してください。

バージョン情報 説明 自動化のユース ケース 開発オプション
カスタム テンプレート モデル カスタム テンプレート モデルは、構造化ドキュメントと半構造化ドキュメントからラベル付きの値とフィールドを抽出します。
定義されたビジュアル テンプレートや一般的なビジュアル レイアウト、フォームを使用して、高度に構造化されたドキュメントから主要データを抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

カスタム構成

詳細 説明 自動化のユース ケース 開発オプション
作成済みカスタム モデル 作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 複数のモデルをトレーニングし、それらをグループ化して類似したフォームの種類を分析する場合に役立ちます (発注書など)。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム分類モデル

Document Intelligence Studio でのカスタム分類モデルのラベル付けを示すスクリーンショット。

バージョン情報 説明 自動化のユース ケース 開発オプション
作成済みの分類モデル カスタム分類モデルは、レイアウト機能と言語機能を組み合わせて、入力ファイル内のドキュメントを検出、識別、分類します。 ● 申込書、給与明細、銀行明細書を含むローン申請パッケージ。
● スキャンされた請求書のコレクション。
Document Intelligence Studio
REST API

Azure AI Document Intelligence は、開発者がインテリジェントなドキュメント処理ソリューションを構築することを可能とするクラウドベースの Azure AI サービスです。 Document Intelligence は、機械学習ベースの光学式文字認識 (OCR) およびドキュメント解釈テクノロジを適用して、ドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。 また、カスタム モデルにラベルを付けてトレーニングし、構造化ドキュメント、半構造化ドキュメント、非構造化ドキュメントからのデータ抽出を自動化することもできます。 各モデルについて詳しくは、概念に関する記事を "ご覧ください"。

モデルの種類 モデル名
ドキュメント分析モデル レイアウト分析モデル
事前構築済みのモデル 請求書モデル
領収書モデル
身分証明書 (ID) モデル
名刺モデル
カスタム モデル カスタム モデル
作成済みモデル

このコンテンツの適用対象: checkmark v2.1 | 最新バージョン: 青のチェックマーク v4.0 (GA)

Document Intelligence のモデルおよび開発オプション

ヒント

  • 強化されたエクスペリエンスと高度なモデル品質のためには、Document Intelligence v3.0 Studio をお試しください。
  • v3.0 Studio では、v2.1 ラベル付きデータでトレーニングされたすべてのモデルがサポートされます。
  • v2.1 から v3.0 への移行の詳細については、API 移行ガイドを参照してください。

Note

以下のモデルと開発オプションは Document Intelligence サービス v2.1 でサポートされています。

表のリンクを使用して、各モデルの詳細を確認したり、API リファレンスを参照したりしてください。

モデル 説明 開発オプション
レイアウト分析 フォームとドキュメントからのテキスト、選択マーク、テーブル、境界ボックス座標の抽出と分析。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
カスタム モデル 個別のビジネス データおよびユース ケースに固有のフォームおよびドキュメントからのデータの抽出と分析。 Document Intelligence ラベル付けツール
REST API
サンプル ラベル付けツール
Document Intelligence Docker コンテナー
請求書モデル 売上請求書の重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
レシート モデル レシートの重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
身分証明書 (ID) モデル 米国の運転免許証と国際パスポートの重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー
名刺モデル 名刺の重要な情報の自動データ処理と抽出。 Document Intelligence ラベル付けツール
REST API
クライアントライブラリ SDK
Document Intelligence Docker コンテナー

データのプライバシーとセキュリティ

AI サービス全般に言えることですが、Document Intelligence サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。 Document Intelligence のデータ、プライバシー、セキュリティに関するページを参照してください。

次のステップ