Azure AI Document Intelligence とは?
重要
- Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
- Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン 2024-07-31-preview にデフォルトで設定されています。
- パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio のカスタム生成 (ドキュメント フィールド抽出) モデルは、米国中北部リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
- 米国中北部
このコンテンツの適用対象: v4.0 (プレビュー) | 以前のバージョン: v3.1 (GA) v3.0 (GA) v2.1 (GA)
このコンテンツの適用対象: v3.1 (GA) | 最新バージョン: v4.0 (プレビュー) | 以前のバージョン: v3.0 v2.1
このコンテンツの適用対象: v3.0 (GA) | 最新バージョン: v4.0 (プレビュー) v3.1 | 以前のバージョン: v2.1
このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (プレビュー)
Note
Form Recognizer は Azure AI Document Intelligence になりました。
- 2023 年 7 月時点で、Azure AI サービスには、以前 Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。
- 価格に変更はありません。
- Cognitive Services および Azure Applied AI という名前は、Azure の課金、コスト分析、価格表、および Price API で引き続き使用されます。
- v3.1 を含むそれ以前のアプリケーション プログラミング インターフェイス (API) や SDK に対する破壊的変更はありません。 v4.0 以降、API と SDK は Document Intelligence に更新されます。
- 一部のプラットフォームでは、まだ名前が更新されていません。 ドキュメントで Form Recognizer または Document Intelligence に言及している場合は、同じ Azure サービスを参照しています。
Azure AI Document Intelligence は、クラウドベースの Azure AI サービスで、インテリジェントなドキュメント処理ソリューションの構築を可能とします。 さまざまなデータ型にまたがる大量のデータが、フォームとドキュメントに格納されます。 Document Intelligence は、データの収集と処理の速度を効果的に管理することを可能とし、運用の改善、情報に基づくデータ主導の意思決定、知見に基づくイノベーションの鍵となります。
|✔️ ドキュメント分析モデル |✔️ 事前構築済みモデル |✔️ カスタム モデル |
汎用抽出モデル
汎用抽出モデルを使用すると、フォームやドキュメントからテキストを抽出し、組織でのアクション、運用、開発などに利用できる、構造化されたビジネス対応コンテンツを返すことができます。
読み取り | 印刷されたテキスト
や手書きテキストを抽出します。
レイアウト | テキスト、テーブル、
ドキュメントの構造を抽出します。
一般的なドキュメント | テキスト、
構造、キーと値のペアを抽出します。
事前構築済みのモデル
事前構築済みモデルを使用して、独自モデルのトレーニングや構築をしなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。
金融サービスと法務
口座取引明細書 | 口座取引明細書から口座情報と詳細を抽出します。
小切手 | 小切手から関連情報を抽出します。
契約 | 契約と関係者の詳細を抽出します。
クレジット カード | 決済カード情報を抽出します。
請求書 | 顧客とベンダーの詳細を抽出します。
給与明細 | 給与明細の詳細を抽出します。
領収書 | 販売 トランザクションの詳細を抽出します。
米国税
米国統一税 | サポートされている米国税フォームから抽出します。
米国税 W-2 | 課税対象の報酬の詳細を抽出します。
米国税 1098 | 1098
バリエーションの詳細を抽出します。
米国税 1099 | 1099
バリエーションの詳細を抽出します。
米国税 1040 | 1040
バリエーションの詳細を抽出します。
米国住宅ローン
米国住宅ローン 1003 | ローン申請の詳細を抽出します。
米国住宅ローン 1004 | 評価から情報を抽出します。
米国住宅ローン 1005 | 在籍証明書から情報を抽出します。
米国住宅ローン 1008 | ローン転送の詳細を抽出します。
米国住宅ローン開示 | 最終的なローンのクロージング条件を抽出します。
個人識別
健康保険証 | 保険のカバレッジ詳細を抽出します。
ID | 検証の詳細を抽出します。
結婚証明書 | 認定された結婚情報を抽出します。
請求書 | 顧客
とベンダーの詳細を抽出します。
領収書 | 販売
トランザクションの詳細を抽出します。
ID | 識別
と検証の詳細を抽出します。
健康保険証 | 健康保険の詳細を抽出します。
名刺 | ビジネス用の連絡先の詳細を抽出します。
契約 |契約
とパーティーの詳細を抽出します。
米国税 W-2 | 課税対象の
報酬の詳細を抽出します。
米国税 1098 | 1098
バリエーションの詳細を抽出します。
カスタム モデル
カスタム モデルは、ラベル付きデータセットを使用してトレーニングされ、ユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 スタンドアロンのカスタム モデルを組み合わせて、作成済みモデルを作成できます。
ドキュメント フィールド抽出モデル
✔️ ドキュメント フィールド抽出モデルをトレーニングして、ドキュメントからラベル付きフィールドを抽出します。
カスタム生成 | 構造化されていない形式とさまざまなテンプレートが使われているドキュメントを対象に、生成 AI を使用したカスタム抽出モデルを構築します。
カスタム ニューラル | 混在型ドキュメントからデータを抽出します。
カスタム テンプレート | 静的レイアウトからデータを抽出します。
カスタム構成 | モデルのコレクションを使用してデータを抽出します。
カスタム分類モデル
✔️ カスタム分類器は、抽出モデルを呼び出す前に、ドキュメントの種類を特定します。
カスタム分類器 | 抽出モデルを呼び出す前に、指定されたドキュメントの種類 (クラス) を特定します。
アドオン機能
Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできるオプション機能がサポートされています。 次のアドオン機能は、2023-07-31 (GA)
以降のリリースで使用できます。
2024-07-31-preview
リリースでは、検索可能な PDF 出力に対する read
モデルのサポートが導入されています。
Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできるオプション機能がサポートされています。 次のアドオン機能は、2023-10-31-preview
およびそれ以降のリリースで使用できます。
分析機能
モデル ID | テキストの抽出 | クエリ フィールド | 段落 | 段落の役割 | 選択マーク | テーブル | キーと値のペア | 言語 | バーコード | ドキュメント分析 | 数式* | スタイルのフォント* | 高解像度* | 検索可能な PDF |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | ✓ | O | O | O | O | O | ✓ | ||||||
事前構築済みレイアウト | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |||
事前構築済みドキュメント | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
事前構築された名刺 | ✓ | ✓ | ✓ | |||||||||||
prebuilt-contract | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1004 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1005 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (バリエーション) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1040(variations) | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - 有効
O - 省略可能
* - 追加コストが発生する Premium 機能
モデルと開発のオプション
注意
以下のドキュメント解釈モデルと開発オプションは Document Intelligence サービス v3.0 でサポートされています。
Document Intelligence を使用して、アプリケーションとワークフローでのドキュメント処理を自動化し、データ主導戦略を強化し、ドキュメント検索機能を強化することができます。 表のリンクから、各モデルの詳細や開発のオプションを参照できます。
Read
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-read | ● 文書からテキストを抽出します。 ● データ抽出 |
● 文書をデジタル化します。 ● コンプライアンスと監査。 ● 手書きのメモの翻訳前の処理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
レイアウト
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
事前構築済みレイアウト | ● 文書からテキストおよびレイアウト情報を抽出します。 ● データ抽出 |
● 構造によるドキュメントのインデックス作成と取得。 ● 財務および医療レポートの分析。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
一般的なドキュメント (2023-10-31 プレビューで非推奨)
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
事前構築済みドキュメント | ● ドキュメントからテキスト、レイアウト、キーと値のペアを抽出します。 ● データとフィールドの抽出 |
● キーと値のペアの抽出。 ● フォーム処理。 ● 調査データの収集と解析。 |
● Document Intelligence Studio ● REST API |
請求書
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-invoice | ● 請求書から主要な情報を抽出します。 ● データとフィールドの抽出 |
● 買掛金勘定処理。 ● 自動的な税の記録とレポート。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Receipt
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-receipt | ● レシートから主要な情報を抽出します。 ● データとフィールドの抽出 ● 領収書モデル v3.0 では、単一ページのホテル領収書の処理がサポートされています。 |
● 経費管理。 ● コンシューマーの行動データ分析。 ● 顧客ロイヤルティ プログラム。 ● 商品返品処理。 ● 自動的な税の記録とレポート。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
アイデンティティ (ID)
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-idDocument | ● パスポートや ID カードから主要な情報を抽出します。 ● ドキュメントの種類 ● 米国の運転免許証から保証、制限、車両分類を抽出します。 |
● Know Your Customer (KYC) 金融サービス ガイドラインのコンプライアンス。 ● 医療アカウント管理。 ID チェックポイントとゲートウェイ。 ● ホテルの登録。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
チェック
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-check | ● 小切手から主要な情報を抽出します。 ● データとフィールドの抽出 |
● クレジット管理。 ● 自動貸し手管理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
給与明細
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-paystub | ● 給与明細から主要な情報を抽出します。 ● データとフィールドの抽出 |
● 従業員給与支払い名簿の詳細の確認。 ● 雇用に関する不正行為の検出。 ● 自動税処理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
口座取引明細書
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-bankStatement | ● 口座取引明細書から主要な情報を抽出します。 ● データとフィールドの抽出 |
● 税処理のユース ケース。 ● 自動会計管理。 ● クレジット/デビット管理。 ● ローン ドキュメント処理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
医療保険カード
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-healthInsuranceCard.us | ● 米国の健康保険カードから主要な情報を抽出します。 ● データとフィールドの抽出 |
● カバレッジと適格性の検証。 ● 予測モデリング。 ● 価値ベースの分析。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
コントラクト モデル
モデル ID | 説明 | 開発オプション |
---|---|---|
事前構築済みコントラクト | 契約同意書と関係者の詳細を抽出します。 ● データおよびフィールドの抽出 |
● Document Intelligence Studio ● REST API ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
クレジット カード モデル
モデル ID | 説明 | 開発オプション |
---|---|---|
prebuilt-creditCard | 契約書とパーティーの詳細を抽出します。 ● データおよびフィールドの抽出 |
● Document Intelligence Studio ● REST API ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
結婚証明書モデル
モデル ID | 説明 | 開発オプション |
---|---|---|
prebuilt-marriageCertificate.us | 契約書とパーティーの詳細を抽出します。 ● データおよびフィールドの抽出 |
● Document Intelligence Studio ● REST API ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国住宅ローン 1003 のフォーム
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-mortgage.us.1003 | ● 1003 ローン申請から主要な情報を抽出します。 ● データおよびフィールドの抽出 |
● Fannie Mae と Freddie Mac のドキュメント要件。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国住宅ローン 1004 フォーム
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-mortgage.us.1004 | ● 1004 評価から主要な情報を抽出します。 ● データおよびフィールドの抽出 |
● Fannie Mae と Freddie Mac のドキュメント要件。 ● 対象資産の市場価値で貸し手/顧客に役立つ統一住宅評価報告書。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国住宅ローン 1005 フォーム
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-mortgage.us.1005 | ● 1005 在籍証明書から主要な情報を抽出します。 ● データおよびフィールドの抽出 |
● Fannie Mae と Freddie Mac のドキュメント要件。 ● 見込み抵当権設定者としての資格を判別するための雇用書類の検証。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国住宅ローン 1008 フォーム
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-mortgage.us.1008 | ● 統一された引受と送付状の概要から重要な情報を抽出します。 ● データおよびフィールドの抽出 |
● 集計データを使用したローン引受処理。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国住宅ローン開示フォーム
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | ● 統一された引受と送付状の概要から重要な情報を抽出します。 ● データおよびフィールドの抽出 |
● 住宅ローン最終詳細の要件。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国税 W-2 モデル
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
prebuilt-tax.us.W-2 | ● IRS US W2 税フォーム (2018 年から 2021 年) から主要な情報を抽出します。 ● データとフィールドの抽出 |
● 自動化された税ドキュメントの管理。 ● 住宅ローンの申し込み処理。 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国税 1098 (およびバリエーション) フォーム
モデル ID | 説明 | 開発オプション |
---|---|---|
prebuilt-tax.us.1098{variation } |
● 1098 フォームのバリエーションから重要な情報を抽出します。 ● データおよびフィールドの抽出 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国税 1099 (およびバリエーション) フォーム
モデル ID | 説明 | 開発オプション |
---|---|---|
prebuilt-tax.us.1099{variation } |
● 1099 フォームのバリエーションから情報を抽出します。 ● データおよびフィールドの抽出 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国税 1040 (およびバリエーション) フォーム
モデル ID | 説明 | 開発オプション |
---|---|---|
prebuilt-tax.us.1040{variation } |
● 1040 フォームのバリエーションから情報を抽出します。 ● データおよびフィールドの抽出 |
● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
米国統一税フォーム
モデル ID | 説明 | 開発オプション |
---|---|---|
prebuilt-tax.us | ●サポートされているいずれかの米国税フォームから情報を抽出します。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
名刺
モデル ID | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
事前構築された名刺 | ● 名刺から主要な情報を抽出します。 ● データとフィールドの抽出 |
● リードとマーケティングの管理。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
カスタム モデルの概要
詳細 | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
カスタム モデル | 一連の代表的なトレーニング ドキュメントのセットから作成されたモデルに基づいて、フォームとドキュメントから構造化データとして情報を抽出します。 | ビジネスやユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
カスタム生成 (ドキュメント フィールド抽出)
Note
カスタム生成モデルは、Azure AI Studio でのみ使用できます。 AI Studio でカスタム生成モデルを試すには、ドキュメント フィールド抽出 (カスタム生成) に関するページを "ご覧ください"
バージョン情報 | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
カスタム生成モデル | カスタム生成モデルは、さまざまなビジュアル テンプレートで非構造化ドキュメントまたは構造化フォームからフィールドを抽出するのに使用されます。 | このモデルでは、生成 AI を使用してフィールドを抽出し、少数のラベル付きサンプルのみで品質を向上させ、グラウンディングと信頼度スコアを使用してプロセスに統合できます。 | Azure AI Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
カスタム ニューラル
注意
カスタム ニューラル モデルをトレーニングするには、buildMode
プロパティを neural
に設定します。
詳細については、「ニューラル モデルのトレーニング」を参照してください。
バージョン情報 | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
カスタム ニューラル モデル | カスタム ニューラル モデルを使用して、構造化されたドキュメント (アンケート、調査)、半構造化されたドキュメント (請求書、発注書)、構造化されていないドキュメント (契約書、レター) からラベル付けされたデータを抽出します。 | 構造化されたドキュメントと構造化されていないドキュメントから、テキスト データ、チェックボックス、表形式フィールドを抽出します。 | Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
カスタム テンプレート
注意
カスタム テンプレート モデルをトレーニングするには、buildMode
プロパティを template
に設定します。
詳細については、「テンプレート モデルのトレーニング」を参照してください。
バージョン情報 | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
カスタム テンプレート モデル | カスタム テンプレート モデルは、構造化ドキュメントと半構造化ドキュメントからラベル付きの値とフィールドを抽出します。 |
定義されたビジュアル テンプレートや一般的なビジュアル レイアウト、フォームを使用して、高度に構造化されたドキュメントから主要データを抽出します。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript SDK |
カスタム構成
詳細 | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
作成済みカスタム モデル | 作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 | 複数のモデルをトレーニングし、それらをグループ化して類似したフォームの種類を分析する場合に役立ちます (発注書など)。 | ● Document Intelligence Studio ● REST API ● C# SDK ● Java SDK ● JavaScript SDK ● Python SDK |
カスタム分類モデル
バージョン情報 | 説明 | 自動化のユース ケース | 開発オプション |
---|---|---|---|
作成済みの分類モデル | カスタム分類モデルは、レイアウト機能と言語機能を組み合わせて、入力ファイル内のドキュメントを検出、識別、分類します。 | ● 申込書、給与明細、銀行明細書を含むローン申請パッケージ。 ● スキャンされた請求書のコレクション。 |
● Document Intelligence Studio ● REST API |
Azure AI Document Intelligence は、開発者がインテリジェントなドキュメント処理ソリューションを構築することを可能とするクラウドベースの Azure AI サービスです。 Document Intelligence は、機械学習ベースの光学式文字認識 (OCR) およびドキュメント解釈テクノロジを適用して、ドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。 また、カスタム モデルにラベルを付けてトレーニングし、構造化ドキュメント、半構造化ドキュメント、非構造化ドキュメントからのデータ抽出を自動化することもできます。 各モデルについて詳しくは、概念に関する記事を "ご覧ください"。
モデルの種類 | モデル名 |
---|---|
ドキュメント分析モデル | ● レイアウト分析モデル |
事前構築済みのモデル | ● 請求書モデル ● 領収書モデル ● 身分証明書 (ID) モデル ● 名刺モデル |
カスタム モデル | ● カスタム モデル ● 作成済みモデル |
このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (プレビュー)
Document Intelligence のモデルおよび開発オプション
ヒント
- 強化されたエクスペリエンスと高度なモデル品質のためには、Document Intelligence v3.0 Studio をお試しください。
- v3.0 Studio では、v2.1 ラベル付きデータでトレーニングされたすべてのモデルがサポートされます。
- v2.1 から v3.0 への移行の詳細については、API 移行ガイドを参照してください。
Note
以下のモデルと開発オプションは Document Intelligence サービス v2.1 でサポートされています。
表のリンクを使用して、各モデルの詳細を確認したり、API リファレンスを参照したりしてください。
モデル | 説明 | 開発オプション |
---|---|---|
レイアウト分析 | フォームとドキュメントからのテキスト、選択マーク、テーブル、境界ボックス座標の抽出と分析。 | ● Document Intelligence ラベル付けツール ● REST API ● クライアントライブラリ SDK ● Document Intelligence Docker コンテナー |
カスタム モデル | 個別のビジネス データおよびユース ケースに固有のフォームおよびドキュメントからのデータの抽出と分析。 | ● Document Intelligence ラベル付けツール ● REST API ● サンプル ラベル付けツール ● Document Intelligence Docker コンテナー |
請求書モデル | 売上請求書の重要な情報の自動データ処理と抽出。 | ● Document Intelligence ラベル付けツール ● REST API ● クライアントライブラリ SDK ● Document Intelligence Docker コンテナー |
レシート モデル | レシートの重要な情報の自動データ処理と抽出。 | ● Document Intelligence ラベル付けツール ● REST API ● クライアントライブラリ SDK ● Document Intelligence Docker コンテナー |
身分証明書 (ID) モデル | 米国の運転免許証と国際パスポートの重要な情報の自動データ処理と抽出。 | ● Document Intelligence ラベル付けツール ● REST API ● クライアントライブラリ SDK ● Document Intelligence Docker コンテナー |
名刺モデル | 名刺の重要な情報の自動データ処理と抽出。 | ● Document Intelligence ラベル付けツール ● REST API ● クライアントライブラリ SDK ● Document Intelligence Docker コンテナー |
データのプライバシーとセキュリティ
AI サービス全般に言えることですが、Document Intelligence サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。 Document Intelligence のデータ、プライバシー、セキュリティに関するページを参照してください。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
Document Intelligence サンプル ラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。