SharePoint での事前構築済みドキュメント処理の概要

[アーティクル]
01/22/2025

注:

2025 年 6 月まで、従量課金制を設定している場合は、限られた量の事前構築済みドキュメント処理やその他の選択されたコンテンツサービスを無償で試すことができます。詳細と制限事項については、「Microsoft Syntexを試してサービスを調べる」を参照してください。

カスタムモデルに加えて、Microsoft Syntexには、情報の抽出を自動化するための事前構築済みモデルが用意されています。

注:

Microsoft は、Syntex でモデルをトレーニングおよび処理するために使用するデータのプライバシーと所有権を尊重します。お客様のorganizationのデータは、AI モデル、大言語モデル、またはその他のモデルをトレーニングするために Microsoft によって使用または転送されることはありません。データは、organizationのテナント内に安全に保持されます。詳細については、「 Microsoft データ保護とプライバシー」を参照してください。

事前構築済みモデルの概要

事前構築済みドキュメント処理では、事前構成済みのモデルを使用して、ドキュメントとドキュメント内の構造化情報を認識します。新しいカスタムモデルをゼロから作成する代わりに、既存の事前トレーニング済みモデルを反復処理して、organizationのニーズに合った特定のフィールドを追加できます。

事前構築済みモデルでは、光学式文字認識 (OCR) とディープラーニングモデルを組み合わせて使用して、特定のドキュメントの種類に共通する定義済みのテキストフィールドとデータフィールドを識別および抽出します。まず、事前構築済みモデルに対してファイルの 1 つを分析します。次に、目的に適した検出されたフィールドを選択します。モデルで必要なフィールドが検出されない場合は、別のファイルを使用してもう一度分析できます。

他のモデルと同様に、事前構築済みのモデルはコンテンツセンターで作成および管理されます。 SharePoint ドキュメントライブラリに適用すると、モデルはコンテンツタイプに関連付けられます。また、抽出される情報を格納する列があります。

モデルを公開したら、コンテンツセンターを使用して、アクセスできる SharePoint ドキュメントライブラリにモデルを適用します。

使用可能な事前構築済みモデル

現時点では、契約、請求書、領収書、機密情報、および単純なドキュメントの 5 つの事前構築済み処理モデルを使用できます。

コントラクト。 事前構築済みの コントラクト処理モデル は、コントラクトドキュメントからキー情報を分析および抽出します。 API は、さまざまな形式でコントラクトを分析し、クライアント名と住所、契約期間、更新日などの主要なコントラクト情報を抽出します。
請求書。 請求書処理モデルは、売上請求書から重要な情報を分析および抽出します。 API は、さまざまな形式で請求書を分析し、顧客名、請求先住所、期日、支払金額などの主要な請求書情報を抽出します。
領収書。 レシート処理モデルは、売上受領書から重要な情報を分析および抽出します。 API は、印刷されたレシートと手書きの領収書を分析し、マーチャント名、マーチャント電話番号、取引日、税金、取引合計などのキーレシート情報を抽出します。
機密情報。 機密情報モデルは、ドキュメントから重要な情報を分析、検出、抽出します。 API は、ドキュメントをさまざまな形式で分析し、個人と財務の識別番号、物理的および電子メールアドレス、電話番号などの重要な機密情報を検出して抽出します。
単純なドキュメント。 シンプルなドキュメント処理モデルは、基本的な構造化ドキュメントからキーと値のペア、選択マーク、名前付きエンティティを抽出するための柔軟で事前トレーニングされたソリューションを提供します。このモデルでは、バーコードと言語検出もサポートされています。

追加の事前構築済みモデルは、今後のリリースで利用できるようになります。

要件と制限事項

このモデルを選択するときに考慮すべき要件については、事前構築済みのドキュメント処理の要件と制限事項に関するページを参照してください。

次の方法で共有

SharePoint での事前構築済みドキュメント処理の概要

事前構築済みモデルの概要

使用可能な事前構築済みモデル

要件と制限事項

フィードバック

その他のリソース