Azure AI Document Intelligence の新機能
このコンテンツの適用対象: v4.0 (プレビュー) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Document Intelligence サービスは、継続的に更新されます。 このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。
重要
GA API がリリースされると、プレビュー API バージョンが廃止されます。 2023-02-28-preview API バージョンは廃止処理中です。このプレビュー API または関連する SDK バージョンをまだ使用している場合は、最新の API バージョンである 2023-07-31 (GA) をターゲットにするようにコードを更新してください。
2024 年 8 月
Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio の新しいドキュメント フィールド抽出モデルは、米国中北部リージョンでのみ使用できます。
米国東部
米国西部 2
"西ヨーロッパ"
米国中北部
-
- Generative AI を使用して、ドキュメントやフォームからフィールドを抽出します。 Document Intelligence は、大規模な言語モデル (LLM) を使用して、さまざまなビジュアル テンプレートで非構造化ドキュメントまたは構造化フォームからフィールドを抽出する新しいドキュメント フィールド抽出モデルを提供するようになりました。 基底値と信頼度スコアにより、新しい Generative AI ベースの抽出は既存のプロセスに適合します。
-
- Document Intelligence は、明示的なカスタム分類モデルを使用したモデルの作成のサポートを追加しました。 新しい作成機能を使用する利点の詳細について説明します。
-
- カスタム分類モデルは、モデルのインプレース更新もサポートするようになりました。
- カスタム分類モデルは、バックアップとディザスター リカバリーを有効にするモデル コピー操作のサポートを追加しました。
- カスタム分類モデルは、入力ドキュメントから分類するページを明示的に指定する操作をサポートするようになりました。
-
- 査定 (フォーム 1004) から情報を抽出します。
- 在籍証明書 (フォーム 1005) から情報を抽出します。
-
- 支払い先、金額、日付、およびその他の関連情報を小切手から抽出します。
-
- 給与明細を処理して賃金、時間、控除、純賃金などを抽出する新しい事前構築。
-
- 期首と期末の残高、取引の詳細を含む口座情報を銀行明細書から抽出する新しい事前構築。
-
- W-2、1098、1099、1040 などの納税申告書から抽出できる新しい統合米国税務書類モデル。
🆕 検索可能な PDF。 事前構築済みの読み取りモデルは、抽出結果から埋め込まれたテキストを含む PDF をダウンロードする PDF 出力をサポートするようになりました。これにより、目次の検索コピーなどのシナリオで PDF を利用できるようになりました。
レイアウト モデルは、向上した図形の検出機能をサポートするようになりました。これにより、ドキュメントの図形を画像ファイルとしてダウンロードして、さらに図形を理解するために使用できるようになりました。 また、レイアウト モデルでは、単一文字、ボックス化されたテキスト、および高密度のテキスト ドキュメントの向上を目的としたスキャン テキストの OCR モデルに対する機能強化も備えています。
-
- Document Intelligence は、一連のドキュメントの分析を支援するバッチ分析操作のサポートを追加したため、開発者エクスペリエンスが簡素化され、効率が向上しました。
-
- クエリ フィールド AI の抽出の品質は、最新のモデルで改善されています。
2024 年 5 月
Document Intelligence Studio では、Microsoft Entra (旧称 Azure Active Directory) 認証のサポートが追加されました。 詳細については、「Document Intelligence Studio の概要」を参照してください。
2024 年 2 月
Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
レイアウト モデル では、図の検出 がサポートされ、階層型ドキュメント構造分析 (セクションとサブセクション) ができるようになりました。 読み取り順序と論理ロール検出の AI 品質も向上しています。
-
- カスタム抽出モデルで、セル、行、テーブル レベルの信頼度スコアがサポートされるようになりました。 テーブル、行、セルの信頼度についての詳細情報。
- カスタム抽出モデルでは、フィールド抽出の AI 品質が向上しています。
- カスタム テンプレート抽出モデルで、重複するフィールドの抽出がサポートされるようになりました。 重複するフィールドとその使用方法の詳細情報。
-
- カスタム分類モデルでは、追加されたサンプルまたはクラスで分類子モデルを更新する必要があるシナリオでの、増分トレーニングをサポートするようになりました。 増分トレーニングについての詳細情報。
- カスタム分類モデルに、Office ドキュメントの型 (.docx、.pptx、.xls) のサポートが追加されました。 ドキュメントの型のサポート拡張についての詳細情報。
-
- 以下の新しいロケールをサポートします。
ロケール コード アラビア語 ( ar
)ブルガリア語 ( bg
)ギリシャ語 ( el
)ヘブライ語 ( he
)マケドニア語 ( mk
)ロシア語 ( ru
)セルビア系キリル語 ( sr-cyrl
)ウクライナ語 ( uk
)タイ語 ( th
)トルコ語 ( tr
)ベトナム語 ( vi
)- 新しい通貨コードをサポート:
通貨 Locale コード BAM
ボスニア兌換マルク ( ba
)BGN
ブルガリア レフ ( bg
)ILS
イスラエル新シェケル ( il
)MKD
マケドニア ディナール ( mk
)RUB
ロシア ルーブル ( ru
)THB
タイ バーツ ( th
)TRY
トルコ リラ ( tr
)UAH
ウクライナ フリヴニャ ( ua
)VND
ベトナム ドン ( vn
)- 税項目で、ドイツ (
de
)、スペイン (es
)、ポルトガル (pt
)、英語圏カナダen-CA
を拡張サポートしました。
-
- 欧州連合 ID と運転免許証のフィールド サポートが拡張されました。
-
- 統一住宅ローン申請書 (フォーム 1003) から情報を抽出します。
- 統一引受転送概要書またはフォーム 1008 から、情報を抽出します。
- 住宅ローンの決算開示から情報を抽出します。
-
- 銀行カードから情報を抽出します。
-
- 結婚証明書から情報を抽出するため新たに事前構築。
2023 年 12 月
REST API 2023-10-31-preview を対象とした Document Intelligence クライアント ライブラリを使用できるようになりました。
2023 年 11 月
Document Intelligence 2023-10-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2023-10-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
-
- 手書き入力用の言語の拡大: ロシア語 (
ru
)、アラビア語 (ar
)、タイ語 (th
)。 - サイバー エグゼクティブ オーダー (EO) へのコンプライアンス。
- 手書き入力用の言語の拡大: ロシア語 (
-
- Office ファイルと HTML ファイルをサポートします。
- マークダウンでの出力のサポート。
- テーブルの抽出、読み取り順序、セクション見出し検出の機能強化。
- Document Intelligence 2023-10-31-preview では、一般的なドキュメント モデル (事前構築済みドキュメント) が非推奨になりました。 今後、キーと値のペアを抽出するには、オプションのクエリ文字列パラメーター
features=keyValuePairs
が有効になっているprebuilt-layout
モデルを使用してください。
-
- すべての価格関連フィールドの通貨が抽出されるようになりました。
-
- メディケアとメディケイド情報の新しいフィールドのサポート。
-
- 新しい 1099 税モデル。 ベース 1099 フォームと、バリエーション (A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB) 。
-
KVK
フィールドのサポート。BPAY
フィールドのサポート。- フィールドに関する多くの微調整。
-
- 多言語ドキュメントのサポート。
- 新しいページ分割オプション: 自動分割、常にページごとに分割、分割なし。
Note
2022-08-31 API の一般提供 (GA) リリースに伴い、関連するプレビュー API は非推奨とされます。 2021-09-30-preview、2022-01-30-preview、または 2022-06-30-preview API バージョンを使用している場合は、2022-08-31 API バージョンをターゲットとするようにアプリケーションを更新してください。 いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。
2023 年 7 月
Note
Form Recognizer は Azure AI Document Intelligence になりました。
- ドキュメント、Azure AI サービスには、以前 Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。
- 価格に変更はありません。
- Cognitive Services および Azure Applied AI という名前は、Azure の課金、コスト分析、価格表、および Price API で引き続き使用されます。
- アプリケーション プログラミング インターフェイス (API) やクライアント ライブラリに破壊的変更はありません。
- 一部のプラットフォームでは、まだ名前が更新されていません。 ドキュメントで Form Recognizer または Document Intelligence に言及している場合は、同じ Azure サービスを参照しています。
Document Intelligence v3.1 (GA)
Document Intelligence バージョン 3.1 API が一般提供 (GA) されました。 API のバージョンは 2023-07-31
に対応しています。
v3.1 API には、新機能と更新機能が導入されています。
- Document Intelligence API ではモジュール性が高まり、オプション機能がサポートされています。 必要な機能を具体的に含むように出力をカスタマイズできるようになりました。 省略可能なパラメーターの詳細を参照してください。
- 1 つのファイルを個々のドキュメントに分割するためのドキュメント分類 API。 ドキュメント分類に関する詳細情報。
- 事前構築済みコントラクト モデル。
- 事前構築済みの米国 1098 税フォーム モデル。
- Read API を使用した Office ファイルの種類のサポート。
- ドキュメント内のバーコード認識。
- 数式認識アドオン機能。
- フォント認識アドオン機能。
- 高解像度ドキュメントのサポート。
- カスタム ニューラル モデルでは、トレーニングにラベル付けされたサンプルが 1 つ必要になりました。
- カスタム ニューラル モデルの言語の増加。 30 の言語でドキュメントのニューラル モデルをトレーニングします。 サポートされている言語の完全な一覧については、言語サポートを参照してください。
- 🆕 事前構築済みの医療保険カード モデル
- 事前構築済みの請求書モデルのロケールの増加。
- 100 を超える言語がサポートされている事前構築済みのレシート モデルの言語とロケールの増加。
- 事前構築済み ID モデルで、ヨーロッパの ID がサポートされるようになりました。
Document Intelligence Studio UX 更新プログラム
✔️ 分析オプション
Document Intelligence では、より高度な分析機能がサポートされるようになりました。Studio では、アドオン機能を簡単に構成するための 1 つのエントリ ポイント ([分析オプション] ボタン) を使用できます。
ドキュメント抽出シナリオに応じて、分析範囲、ドキュメント ページ範囲、オプションの検出、プレミアム検出機能を構成します。
Note
Document Intelligence Studio では、フォントの抽出は視覚化されません。 ただし、フォントの検出結果については JSON 出力のスタイル セクションで確認できます。
✔️ 事前構築済みモデルまたは独自のモデルのいずれかを使用してドキュメントに自動ラベル付けする
カスタム抽出モデル ラベル付けページで、Document Intelligent Service の事前構築済みモデルまたは自分が以前にトレーニングしたモデルのいずれかを使用して、ドキュメントの自動ラベル付けが行えるようになりました。
一部のドキュメントでは、自動ラベル付けを実行した後に重複ラベルが存在する場合があります。 後でラベル付けページでラベルが重複しないように、ラベルを変更してください。
✔️ 自動ラベル付けテーブル
カスタム抽出モデルのラベル付けページで、手動でテーブルにラベル付けしなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。
✔️ テスト ファイルをトレーニング データセットに直接追加する
カスタム抽出モデルをトレーニングしたら、テスト ページを使用して、必要に応じてテスト ドキュメントをトレーニング データセットにアップロードすることで、モデルの品質を改善します。
一部のラベルに対して低い信頼度スコアが返される場合は、ラベルが正しいことを確認します。 正しくない場合は、モデルの品質を改善するために、それらをトレーニング データセットに追加し再ラベル付けを行います。
✔️ カスタム プロジェクトでドキュメント リスト オプションとフィルターを使用する
カスタム抽出モデルのラベル付けページを使用します。 検索、フィルター、並べ替えを使用することで、トレーニング ドキュメント間を簡単に移動できるようになりました。
グリッド ビューを使用してドキュメントをプレビューするか、リスト ビューを使用してドキュメント内をより簡単にスクロールできます。
✔️ プロジェクト共有
- カスタム抽出プロジェクトを簡単に共有できます。 詳細については、「プロジェクト共有とカスタム モデル」を参照してください。
2023 年 5 月
Build 2023 で更新されたドキュメントの紹介
🆕 Document Intelligence の概要では、ナビゲーションが強化され、アクセス ポイントが体系化され、イメージがエンリッチされました。
🆕 Document Intelligence モデルの選択は、プロジェクトとワークフローに最適な Document Intelligence ソリューションを選ぶためのガイダンスを提供します。
2023 年 4 月
最新の Document Intelligence クライアント ライブラリのパブリック プレビュー リリースの発表
Document Intelligence REST API バージョン 2023-02-28-preview では、パブリック プレビュー リリースのクライアント ライブラリがサポートされています。 このリリースには、.NET/C# (4.1.0-beta-1)、Java (4.1.0-beta-1)、JavaScript (4.1.0-beta-1)、Python (3.3.0b.1) クライアント ライブラリ で使用できる次の新機能が含まれています。
詳細については、Document Intelligence SDK (パブリック プレビュー)、および 2023 年 3 月リリースのノートを参照してください
2023 年 3 月
重要
2023-02-28-preview
機能は現在、次のリージョンでのみご利用いただけます:
- 西ヨーロッパ
- 米国西部 2
- 米国東部
- カスタム分類モデルは、
2023-02-28-preview
API 以降の Document Intelligence の新機能です。 - 一般ドキュメント モデルに追加されたクエリ フィールド機能では、Azure OpenAI モデルを使用して、ドキュメントから特定のフィールドを抽出します。 Document Intelligence Studio を使用して、クエリ フィールドを含む一般ドキュメント機能をお試しください。 クエリ フィールドは現在、
East US
リージョンのリソースに対してのみアクティブです。 - アドオン機能:
- カスタム抽出モデルの更新:
- カスタム ニューラル モデルで、トレーニングと分析用に追加された言語がサポートされるようになりました。 オランダ語、フランス語、ドイツ語、イタリア語、スペイン語のニューラル モデルをトレーニングします。
- カスタム テンプレート モデルの署名検出機能が強化されました。
- Document Intelligence Studio 更新プログラム:
- 分類やクエリ フィールドなどのすべての新機能のサポートに加えて、Studio ではカスタム モデル プロジェクトのプロジェクト共有が可能になりました。
- 限定的なプレビューの新しいモデルとして、ワクチン接種カード、契約、米国税 1098、米国税 1098-E、米国税 1098-T が追加されました。 限定的なプレビュー モデルのアクセスを要求するには、Document Intelligence プライベート プレビュー要求フォームに入力して送信してください。
- レシート モデルの更新:
- レシート モデルでは、熱レシートのサポートが追加されました。
- レシート モデルでは、18 言語と 3 つのリージョン言語 (英語、フランス語、ポルトガル語) の言語サポートが追加されました。
- レシート モデルで
TaxDetails
抽出がサポートされるようになりました。
- レイアウト モデルでテーブル認識が改善されました。
- 読み取りモデルで、1 桁の文字認識が改善されました。
2023 年 2 月
v3.0 用の Document Intelligence コンテナーを選択できるようになりました。
現在、Read v3.0 と Layout v3.0 のコンテナーを使用できます。
詳細については、Document Intelligence コンテナーのインストールと実行に関するページを参照してください。
2023 年 1 月
事前構築済みのレシート モデル - サポートされている言語が追加されました。 レシート モデルで、これらの追加された言語とロケールがサポートされるようになりました
- 日本語 - 日本 (ja-JP)
- フランス語 - カナダ: (fr-CA)
- オランダ語 - オランダ (nl-NL)
- 英語 - アラブ首長国連邦 (en-AE)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデル - サポートされている言語が追加されました。 請求書モデルで、これらの追加された言語とロケールがサポートされるようになりました
- 英語 - 米国 (en-US)、オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-GB)、インド (en-IN)
- スペイン語 - スペイン (es-ES)
- フランス語 - フランス (fr-FR)
- イタリア語 - イタリア (it-IT)
- ポルトガル語 - ポルトガル (pt-PT)
- オランダ語 - オランダ (nl-NL)
事前構築済みの請求書モデル - 認識されるフィールドが追加されました。 請求書モデルで、これらの追加されたフィールドが認識されるようになりました
- Currency code
- 支払いオプション
- 割引合計
- 税目 (en-IN のみ)
事前構築済みの ID モデル - サポートされているドキュメントの種類が追加されました。 ID モデルで、これらの追加されたドキュメントの種類がサポートされるようになりました
- 米国の軍 ID
ヒント
2023 年 1 月のすべての更新プログラムは、REST API バージョン 2022-08-31 (GA) で入手できます。
事前構築済みのレシート モデル — 追加の言語サポート:
事前構築済みのレシート モデルで、次の言語のサポートが追加されました。
- 英語 - アラブ首長国連邦 (en-AE)
- オランダ語 - オランダ (nl-NL)
- フランス語 - カナダ: (fr-CA)
- ドイツ語 - (de-DE)
- イタリア語 - (it-IT)
- 日本語 - 日本 (ja-JP)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデル - 追加の言語サポートとフィールド抽出
事前構築済みの請求書モデルで、次の言語のサポートが追加されました。
- 英語 - オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-UK)、インド (en-IN)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデルで、次のフィールド抽出のサポートが追加されました。
- Currency code
- 支払いオプション
- 割引合計
- 税目 (en-IN のみ)
事前構築済みの身分証明書モデル - 追加の証明書の種類のサポート
事前構築済みの身分証明書モデルで、次の証明書の種類のサポートが追加されました。
- インド、カナダ、英国、オーストラリアをサポートする運転免許証の拡張
- 米国の軍 ID カードと証明書
- インドの ID カードと証明書 (PAN および Aadhaar)
- オーストラリアの ID カードと証明書 (フォト カード、Key-pass ID)
- カナダの ID カードと証明書 (ID カード、メープル カード)
- 英国の ID カードと証明書 (国/地域の ID カード)
2022 年 12 月
Document Intelligence Studio 更新プログラム
12 月の Document Intelligence Studio リリースには、Document Intelligence Studio の最新の更新プログラムが含まれています。 カスタム モデルのラベル付けサポートを中心に、ユーザー エクスペリエンスが大幅に改善されています。
ページ範囲。 Studio で、ドキュメントの指定ページの分析がサポートされるようになりました。
カスタム モデルのラベル付け
Layout API の自動実行。 カスタム モデルのセットアップ プロセスで、BLOB ストレージ内のすべてのドキュメントに対して Layout API を自動的に実行するように選択できます。
検索。 Studio に、ドキュメント内の単語を検索する検索機能が追加されました。 この改良により、ラベル付けしながらの操作が容易になります。
ナビゲーション。 ラベルを選択して、ドキュメント内のラベル付き単語をターゲットにすることができます。
テーブルの自動ラベル付け。 ドキュメント内のテーブル アイコンを選択すると、ラベル付けビューで、抽出されたテーブルの自動ラベル付けを選択できます。
ラベルのサブタイプと第 2 レベルのサブタイプ Studio で、テーブル列、テーブル行のサブタイプ、および日付や数値などの型の第 2 レベルのサブタイプがサポートされるようになりました。
カスタム ニューラル モデルの構築が、US Gov バージニア リージョンでサポートされるようになりました。
プレビュー API バージョン
2022-01-30-preview
および2021-09-30-preview
が、2023 年 1 月 31 日に廃止されます。 サービスの中断を避けるために、2022-08-31
API バージョンに更新してください。
2022 年 11 月
- Azure AI Document Intelligence ライブラリの最新の安定したリリースを発表
- このリリースには、.NET、Java、JavaScript、Python クライアント ライブラリの重要な変更と更新が含まれています。 詳細については、「Azure SDK DevBlog」を参照してください。
- 最も重要な機能強化は、
DocumentAnalysisClient
とDocumentModelAdministrationClient
の 2 つの新しいクライアントの導入です。
2022 年 10 月
Document Intelligence のバージョン管理されたコンテンツ
Document Intelligence ドキュメントが更新され、バージョン管理されたエクスペリエンスが提供されるようになりました。 これで、
v3.0 GA
エクスペリエンスまたはv2.1 GA
エクスペリエンスを対象とするコンテンツを表示することを選択できます。 v3.0 エクスペリエンスが既定です。
Document Intelligence Studio のサンプル コード
- Document Intelligence Studio ラベル付けエクスペリエンスのサンプル コードは、GitHub で使用できるようになりました。 顧客は、Document Intelligence を開発して独自の UX に統合したり、Document Intelligence Studio サンプル コードを使用して独自の新しい UX を構築したりすることができます。
言語の増加
- 最新のプレビュー リリースでは、Document Intelligence の Read (OCR)、Layout、Custom テンプレート モデルで 134 の新しい言語がサポートされています。 これらの言語の追加には、ギリシャ語、ラトビア語、セルビア語、タイ語、ウクライナ語、ベトナム語、いくつかのラテン語とキリル語が含まれます。 Document Intelligence の最新の GA と新しいプレビュー バージョンでサポートされる言語は、合計 299 個になりました。 サポートされているすべての言語については、サポートされている言語のページを参照してください。
- API または対応する SDK を使用してアプリケーションで新しい言語をサポートする場合は、REST API パラメーター
api-version=2022-06-30-preview
を使用します。
新しい事前構築済みコントラクト モデル
- パーティ、タイトル、コントラクト ID、実行日などの情報をコントラクトから抽出する新しい事前構築。 コントラクトは現在プレビュー段階です。こちらからアクセスを要求してください。
カスタム ニューラル モデルをトレーニングするためのリージョンの拡大
- カスタム ニューラル モデルのトレーニングは、追加リージョンでサポートされるようになりました。
- 米国東部
- 米国東部 2
- US Gov アリゾナ
- カスタム ニューラル モデルのトレーニングは、追加リージョンでサポートされるようになりました。
2022 年 9 月
Note
バージョン 4.0.0 以降、Document Intelligence サービスの最新機能を活用するために、新しいクライアント セットが導入されています。
SDK バージョン 4.0.0 GA リリースには、次の更新が含まれています。
- バージョン 4.0.0 GA (2022-09-08)
- REST API v3.0 および v2.0 クライアントをサポート
カスタム ニューラル モデルをトレーニングするための領域拡張が、6 つの新しい領域でサポートされるようになりました
- オーストラリア東部
- 米国中部
- 東アジア
- フランス中部
- 英国南部
- 米国西部 2
トレーニングがサポートされているリージョンの完全な一覧については、カスタム ニューラル モデルに関する記事を参照してください。
Document Intelligence SDK のバージョン
4.0.0 GA
リリース:- Document Intelligence クライアント ライブラリ バージョン 4.0.0 (.NET/C#、Java、JavaScript) とバージョン 3.2.0 (Python) が一般公開され、実稼働アプリケーションで使用できます。
- Document Intelligence クライアント ライブラリの詳細については、SDK の概要に関するページを参照してください。
- プログラミング言語の移行ガイドを使用してアプリケーションを更新します。
2022 年 8 月
Document Intelligence SDK ベータ版 2022 年 8 月のプレビュー リリースには、次の更新が含まれています。
バージョン 4.0.0-beta.5 (2022-08-09)
Document Intelligence v3.0 の一般提供
- Document Intelligence REST API v3.0 が一般公開され、運用アプリケーションで使用できるようになりました。 REST API バージョン 2022-08-31 でアプリケーションを更新してください。
Document Intelligence Studio 更新プログラム
- 次の手順。 Studio の各モデル ページの下に、[次の手順] セクションが追加されました。 ユーザーは、サンプル コード、トラブルシューティング ガイドライン、価格情報をすばやく参照できます。
- カスタム モデル。 Studio には、ラベル付けの効率を向上させるために、カスタム モデル プロジェクトでラベルを並べ替える機能が含まれるようになりました。
- モデルのコピー: カスタム モデルは、Studio 内から Document Intelligence サービス間でコピーできます。 この操作により、トレーニング済みのモデルを他の環境やリージョンに昇格できます。
- ドキュメントの削除。 Studio では、カスタム プロジェクト内のラベル付きデータセットからドキュメントを削除できるようになりました。
Document Intelligence サービス更新プログラム
- prebuilt-read。 Read OCR モデルは Document Intelligence でも使用できるようになり、2 つの新機能として、段落と言語検出を備えています。 Document Intelligence の読み取りは、Document Intelligence のより広範なドキュメント インテリジェンス機能に合わせた高度なドキュメント シナリオを対象とします。
- 事前構築済みレイアウト。 レイアウト モデルでは、段落が抽出され、抽出されたテキストが段落、タイトル、セクション見出し、脚注、ページ ヘッダー、ページ フッター、またはページ番号のいずれであるかが抽出されます。
- 事前構築済みの請求書。 TotalVAT フィールドと Line/VAT フィールドが、それぞれ既存のフィールド TotalTax と Line/Tax に解決されるようになりました。
- 事前構築済みの ID ドキュメント。 データ抽出で、米国の州 ID、社会保障、グリーン カードがサポートされます。 パスポート ビザ情報がサポートされます。
- 事前構築済みのレシート。 フランス語 (fr-FR)、スペイン語 (es-ES)、ポルトガル語 (pt-PT)、イタリア語 (it-IT)、ドイツ語 (de-DE) のロケール サポートが拡張されました。
- 事前構築済みの名刺。 住所、市区町村、都道府県、国および地域、郵便番号などの住所コンポーネントのサブフィールドを抽出するためのアドレス解析のサポート。
AI 品質の改善
- prebuilt-read。 単一文字、手書きの日付、金額、名前、領収書や請求書でよく見られるその他キー データのサポートが強化され、デジタル PDF ドキュメントの処理が改善されました。
- 事前構築済みレイアウト。 トリミングされたテーブルの検出、罫線のないテーブルの検出、長いスパンセルの認識の向上をサポートします。
- 事前構築済みドキュメント。 値とチェック ボックスの検出が改善されました。
- カスタム ニューラル。 テーブルの検出と抽出の精度が向上しました。
2022 年 6 月
- Document Intelligence SDK ベータ版 2022 年 6 月のプレビュー リリースには、次の更新プログラムが含まれています。
バージョン 4.0.0-beta.4 (2022-06-08)
6 月の Document Intelligence Studio のリリースは、Document Intelligence Studio の最新の更新プログラムです。 この更新プログラムでは、ユーザー エクスペリエンスとユーザー補助に関するかなりの機能強化が行われました。
- JavaScript と C# のコード サンプル。 既にある Python のコード サンプルに加え、JavaScript と C# コード サンプルが Studio の [コード] タブに追加されました。
- 新しいドキュメント アップロード UI。 Studio では、ドキュメントを新しいアップロード ユーザー インターフェイスにドラッグ アンド ドロップしてアップロードできるようになりました。
- カスタム プロジェクトの新機能。 カスタム プロジェクトでは、プロジェクトの構成時にストレージ アカウントと BLOB の作成ができるようになりました。 さらに、カスタム プロジェクトでは、Studio 内でのトレーニング ファイルの直接アップロードや、既存のカスタム モデルのコピーができるようになりました。
Document Intelligence v3.0 2022 年 6 月 30 日プレビュー リリースでは、機能 API 全体に広範な更新が行われています。
- レイアウトでは、構造の抽出が拡張されています。 レイアウトに、セクション、セクション ヘッダー、段落などの構造要素が追加されています。 この更新プログラムを使用すると、ドキュメントのセグメント化シナリオをより詳細に設定できます。 識別された構造要素の完全な一覧については、拡張構造に関するページを参照してください。
- カスタム ニューラル モデルの表形式フィールドがサポートされます。 カスタム ドキュメント モデルで表形式フィールドがサポートされるようになりました。 既定では、表形式フィールドも複数ページです。 カスタム ニューラル モデルの表形式フィールドの詳細については、表形式フィールドに関するページを参照してください。
- カスタム テンプレート モデルの表形式フィールドでは、ページ間テーブルがサポートされます。 カスタム フォーム モデルで、ページ間の表形式フィールドがサポートされるようになりました。 カスタム テンプレート モデルの表形式フィールドの詳細については、表形式フィールドに関するページを参照してください。
- 請求書モデルの出力に、一般的なドキュメントのキーと値のペアが含まれるようになりました。 請求書に、事前構築済みモデルに含まれるフィールド以外の必須フィールドが含まれている場合、一般的なドキュメント モデルでは、キーと値のペアで出力が補完されます。 「キーと値のペア」を参照してください。
- 請求書言語の拡張。 請求書モデルには、拡張された言語サポートが含まれています。 サポートされている言語に関するページを参照してください。
- 事前構築済みの名刺に、日本語サポートが含まれるようになりました。 サポートされている言語に関するページを参照してください。
- 事前構築済みの ID ドキュメント モデル。 ID ドキュメント モデルで、米国の運転免許証から DateOfIssue、Height、Weight、EyeColor、HairColor、DocumentDiscriminator が抽出されるようになりました。 「フィールドの抽出」を参照してください。
- 読み取りモデルで、一般的な Microsoft Office ドキュメントの種類がサポートされるようになりました。 Word (docx)、Excel (xlsx)、PowerPoint (pptx) などのドキュメントの種類が、Read API でサポートされるようになりました。 読み取りデータ抽出に関するページを参照してください。
2022 年 2 月
バージョン 4.0.0-beta.3 (2022-02-10)
Document Intelligence v3.0 プレビュー リリースでは、いくつかの新機能、機能と機能強化が導入されています。
- カスタム ニューラル モデルまたはカスタム ドキュメント モデルは、構造化フォーム、半構造化ドキュメント、非構造化ドキュメントからテキストと選択マークを抽出する、新しいカスタム モデルです。
- W-2 事前構築済みモデル は、税務報告および所得検証シナリオのために W-2 フォームからフィールドを抽出するための新しい事前構築モデルです。
- 読み取り API は、印刷されたテキスト行、単語、テキスト位置、検出された言語、および手書きテキストを抽出します (検出された場合)。
- 一般的なドキュメント事前トレーニング済みモデルが更新され、フォームとドキュメントからの API テキスト、テーブル、構造、キーと値のペアに加えて、選択マークがサポートされます。
- Invoice API 請求書の事前構築済みモデルは、スペイン語の請求書もサポートするように拡張されています。
- Document Intelligence Studio では、Read、W2、Hotel のレシート サンプルの新しいデモと、新しいカスタム ニューラル モデルのトレーニングのサポートが追加されます。
- 言語拡張: Document Intelligence の読み取り、レイアウト、カスタム フォームでは、アラビア語、ヒンディ語、およびアラビア文字とデーヴァナーガリー文字を使用したその他の言語を含む 42 の新しい言語のサポートが追加され、164 の言語に範囲が広がっています。 手書き言語のサポートが、日本語と韓国語に拡張されています。
新しい v3.0 プレビュー API の使用を開始します。
Document Intelligence モデルのデータ抽出:
モデル テキストの抽出 キーと値のペア 選択マーク テーブル シグネチャ Read ✓ 一般ドキュメント ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ 請求書 ✓ ✓ ✓ ✓ Receipt ✓ ✓ ✓ 身分証明書 ✓ ✓ 名刺 ✓ ✓ カスタム テンプレート ✓ ✓ ✓ ✓ ✓ カスタム ニューラル ✓ ✓ ✓ ✓ Document Intelligence SDK ベータ版のプレビュー リリースには、次の更新プログラムが含まれています。
-
- カスタム テンプレート (以前のカスタム フォーム)。
- カスタム ニューラル
- カスタム モデル - ビルド モード
W-2 事前構築済みモデル (prebuilt-tax.us.w2)。
読み取り事前構築済みモデル (prebuilt-read)。
請求書の事前構築済みモデル (スペイン語) (prebuilt-invoice)。
-
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
Document Intelligence サンプル ラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。