最初のモデルの作成
次の手順では、AI Builder でドキュメント処理モデルを作成する方法について説明します。 このガイド付きエクスペリエンスでは、モデル作成プロセスの各ステップについて説明します。 作業内容を保存し、いつでも再開できます。 ステップ間を移動すると、進行状況が自動的に保存されます。
AI Builder へサインインする
AI Builder にサインインするには、次の手順を実行します。
Power Automate に移動して、自分の組織アカウントでサインインします。
左側のナビゲーション ウィンドウで、AI ハブ、AI モデルの順に選択します。 AI ハブのオプションが表示されない場合、詳細オプションを選択すると、ポップアップ ウィンドウ上でAI ハブが見つかるはずです。
Select ドキュメントからカスタム情報を抽出するを選択します。
独自のドキュメントを使用してモデルを作成する場合は、同じレイアウトを使用するサンプルが 5 つ以上あることを確認してください。 それ以外の場合は、このガイドで使用するサンプル データを使用できます。 サンプル データは、英語版または日本語版でダウンロードできます
カスタム モデルの作成を選択します。
ドキュメントの種類を選択する
ドキュメントの種類の選択では、次の 3 つのオプションがあります。
構造化および半構造化ドキュメント。 構造化および半構造化ドキュメントでは、特定のレイアウトに対するフィールド、テーブル、チェックボックス、その他の項目が同様の場所に置かれます。 構造化および半構造化ドキュメントの例には、請求書、発注書、配送注文書、納税申告書などがあります。
構造化されていない自由形式ドキュメント。 構造化されていないドキュメントは、構造が設定されておらず、その多くは段落の数がそれぞれに異なります。 構造化されていないドキュメントには、契約書、作業明細書、手紙などがあります。
請求書。 請求書ドキュメントは、標準の買掛金勘定フォームです。 このモデル タイプには標準的なフィールドが含まれており、追加のカスタム データの抽出や標準データの更新を行うように、このモデルに指示することができます。 このようなドキュメントの例として、請求書や発注書があります。
構造化ドキュメントを選択し、次へを選択します。
抽出する情報を選択する
この手順では、抽出の方法をモデルに指示するために必要なフィールドとテーブルを定義します。
英語版または日本語版で提供されているサンプル データは、2 つの異なるプロバイダーからの請求書です。 抽出する次のフィールドを定義します。
請求書番号
顧客 ID
合計金額
期日
+ 追加を選択して、テキスト フィールドを選択します。 続いて、次へを選択します。
テキスト フィールド名を請求書番号と入力し、完了を選択します。この手順を顧客ID に対して繰り返します。
+ 追加を選択して、番号フィールド (プレビュー) を選択します。 続いて、次へを選択します。
番号フィールドの名前を合計金額と入力し、完了を選択します。
+ 追加を選択し、日付フィールド (プレビュー) を選択します。
"日付" フィールドの名前を期日と入力し、完了を選択します。
モデルはドキュメントからこれらのフィールドを抽出する方法を学習します。
請求書に存在する明細行品目ごとに、説明と合計金額を抽出することもできます。 これを行うには、テーブル名の項目と、列の説明および品目合計を定義します。
+ 追加、テーブルの追加、次への順に選択します。
テーブル名を品目として定義します。 次に、説明と品目合計の 2 つの列を定義します。
列 1 を選択し、名前を説明 に変更します。 確認 を選択します。
+ 新しい列を選択し、列名に品目合計と入力します。 その後、追加を選択します。 最後に完了を選択します。
次へを選択して、モデルの次の手順に進みます。
コレクションを定義し、ドキュメントをアップロードする
コレクションは、同じレイアウトを共有するドキュメントのグループです。 モデルを処理するさまざまなレイアウトを持つドキュメントとしてコレクションを作成します。 2 つの請求書プロバイダーがあり、各請求書プロバイダーは異なる請求書テンプレートを使用しているため、2 つのコレクションを定義します。
新しいコレクションを選択し、最初のコレクションの名前を Adatum に変更します。
2 番目の新しいコレクションを追加し、2 番目のコレクションに Contoso という名前を付けます。
2 つのコレクションを作成しました。コレクションごとに少なくとも 5 つのサンプルをアップロードする必要があります。
Adatum と名付けたコレクションには、AI Builder Document processing Sample Data/Adatum/Train フォルダーにある 5 つのドキュメントをアップロードします。 Contoso のトレーニング ドキュメントについても同じ手順を踏みます。
各コレクションの + アイコンを選択し、5 つの "トレーニング" ドキュメントを各会社それぞれのコレクションに追加します。
各コレクションにサンプル ドキュメントをアップロードしたら、次へを選択して次に進みます。
ドキュメントにタグを付ける
次に、定義したフィールドやテーブルを抽出する方法を AI モデルに指定します。 それには、アップロードしたサンプル ドキュメントにタグ付けを行います。 各ドキュメントの必要なフィールドすべてにタグ (つまり注釈) を付けると、そのドキュメントにチェックマークが表示され、上隅の赤いドットが表示されなくなります。
タグ付けプロセスを開始するには、右側のパネルで Contoso コレクションを選択します。
フィールドにタグを付ける
ここでは、定義したフィールドの請求書番号、期日、合計金額のタグ付けから始めます。 フィールドにタグを付けるには、ドキュメントのフィールドの周囲に四角形を描画し、対応するフィールド名を選択します。
いつでもサイズを変更して選択範囲を調整できます。
ドキュメント内のさまざまな単語にマウスカーソルを合わせると、水色のボックスが表示されます。 このボックスは、単語の囲りに四角形を描画してフィールドを選択できることを示してます。
ドキュメントにないフィールドまたはテーブル
すべての定義済みのフィールドおよびテーブルが必ずしもすべてのドキュメントに含まれている必要はありません。 Contoso コレクションには顧客 ID フィールドが存在しないことがわかります。 右パネルのフィールドまたはテーブルに移動し、フィールド右側の省略記号 (…) を選択してから、ドキュメントにないを選択することで、フィールドが存在しないことを AI モデルに伝えます。
テーブルにタグを付ける
テーブルにタグ付けするには、次の方法を使用します。
目的のフィールドの周囲に四角形を描画し、対応するフィールド名を選択します。
右側のパネルの内容が変わります。
行区切り記号の間を左クリックして行を描画します。
Ctrl + 左クリック (または macOS 上で ⌘ 左クリック) を押して列を描画します。
行と列を設定したら、ヘッダー列を選択し、目的のヘッダーにマッピングすることで、抽出するヘッダーを割り当てます。
テーブルと抽出されたデータがどのように表示されるかを示すプレビューが右側のパネルに表示されます。
テーブルのヘッダーがタグ付けされている場合は、[最初の行を無視] を選択し、テーブルのヘッダーがテーブル コンテンツとして抽出されないようにします。
すべてのドキュメントにタグを付ける
1 つのドキュメントへのタグ付けが完了したら、右上のドキュメント プレビューの下にあるナビゲーション矢印をクリックして、次のドキュメントに移動します。
1 つのコレクションへのタグ付けが完了したら、再びコレクション リストに移動して 2 番目のコレクションにタグを付けます。
モデルの概要とトレーニング
すべてのコレクションのすべてのドキュメントにタグを付けたら、次の手順を実行します。
画面の下部にある次へボタンを選択します。
モデルの概要をレビューします。 抽出する情報には、サンプル 10 件中 5 件にのみ、顧客 ID と期限が表示されますが、その他すべての項目はサンプル 10 件すべてに表示されます。
すべて問題がない場合は、トレーニングを選択します。
次の手順
AI Builder でドキュメント処理モデルを作成したので、モデルをテストし、それを Power Apps と Power Automate で使用する方法について学習します。