Microsoft Syntex 中的模型類型概觀

發行項
11/22/2024

^{適用於： ✓ 所有自定義模型 |✓ 所有預先建置的模型}

瞭解 Microsoft Syntex 中的內容是從文件處理模型開始。文件處理模型可讓您識別並分類上傳至 SharePoint 文檔庫的檔，然後從每個檔案擷取所需的資訊。

當套用至 SharePoint 文件庫時，模型與一個內容類型相關聯，且具有儲存所擷取資訊的欄標籤。您建立的內容類型儲存在 SharePoint 內容類型庫中。您也可以選擇使用現有內容類型來使用其架構。

Syntex 使用自定義模型和預先建置的模型。

顯示 Syntex 自定義和預建模型類型的圖表。

模型可以是在內容中心建立的企業模型，或是在本機 SharePoint 網站上建立的本機模型。

自訂模型

您選擇的自定義模型類型取決於您使用的檔案類型、檔案的格式和結構，以及您要套用模型的位置。

自訂模型包括：

非結構化文件處理
手繪多邊形文件處理
結構化文件處理

若要檢視自定義模型中的並存差異，請參閱比較自定義模型。

非結構化文件處理

使用非結構化文件處理模型自動分類檔，並從中擷取資訊。它最適用於非結構化文件，如信件或合约。這些文件必須具有可根據片語或模式識別的文字。所識別的文字指定了檔案的類型（它的分類）和您想要擷取的內容（它的擷取器）。

例如，非結構化文件可以是可以用不同方式撰寫的合同續約函。不過，資訊會一致地存在於每個合約續約檔的本文中，例如文字字串 “Service start date of” 後面接著實際日期。

此模型類型支援最廣泛的檔類型，並支持超過40種語言。

當您建立非結構化文件處理模型時，請使用 [單一類別模型 ] 選項。

如需詳細資訊，請參閱非結構化文件處理概觀。

手繪多邊形文件處理

使用手繪多邊形文件處理模型，從非結構化和手繪多邊形文件自動擷取資訊，例如字母和合約，其中資訊可以出現在檔中的任何位置。

手繪多邊形文件處理模型會使用 Microsoft Power Apps AI Builder 在 Syntex 中建立和定型模型。

注意事項

手繪多邊形文件處理模型尚無法在某些區域中使用。如需詳細資訊，請參閱依區域的功能可用性。

因為貴組織會從各種來源接收大量信件和檔，例如郵件、傳真和電子郵件，所以處理這些檔並手動將其輸入資料庫可能需要相當長的時間。藉由使用 AI 從這些檔擷取文字和其他資訊，此模型會將此程式自動化。

當您不需要自動分類檔類型，且支持超過 40 種語言時，此模型類型是 PDF 或影像檔中檔的最佳選項。

當您建立手繪多邊形文件處理模型時，請使用 [手繪多邊形擷取模型] 選項。

如需詳細資訊，請參閱結構化和手繪多邊形文件處理概觀。

結構化文件處理

使用結構化文件處理模型自動識別欄位和數據表值。最適合結構化或半結構化的檔，例如表單和發票。

結構化文件處理模型會使用Microsoft Power Apps AI Builder 檔處理 (先前稱為表單處理) ，以在 Syntex 中建立和定型模型。

此模型類型支援最廣泛的語言，並已定型以從範例文件了解表單的版面配置，然後學習尋找從類似位置擷取所需的數據。 Forms 通常會有更結構化的配置，其中實體位於相同的位置 (例如，稅務窗體上的社會安全號碼) 。

當您建立結構化文件處理模型時，請使用 [結構化擷取模型 ] 選項。

如需詳細資訊，請參閱結構化和手繪多邊形文件處理概觀。

預先建立的模型

如果您不需要建置自定義模型，您可以使用已針對特定結構化檔定型的預先建置文件處理模型。

預先建置的模型包括：

合約處理
發票處理
收據處理
敏感性信息處理
簡單文件處理

預建模型已預先訓練能識別文件和文件中結構化的資訊。不必從頭開始建立新自訂模型，您可以重複現有的預先訓練模型，以新增符合組織需求的特定欄位。

合約處理

預先建置的合約處理模型會分析並擷取合約檔中的重要資訊。 API 會分析各種格式的合約，並擷取密鑰合約資訊，例如用戶端或合作物件名稱、帳單地址、管轄權和到期日。

如需合約處理模型的詳細資訊，請參閱使用預先建置的模型從合約擷取資訊。

發票處理

預先建置的發票處理模型會分析並擷取銷售發票中的密鑰資訊。 API 會以各種格式分析發票，並擷取重要的發票資訊，例如客戶名稱、帳單位址、到期日和到期金額。

如需發票處理模型的詳細資訊，請參閱使用預先建置的模型從發票擷取資訊。

收據處理

預先建置的收據處理模型會分析並擷取銷售收據中的重要資訊。 API 會分析列印和手寫收據，並解壓縮重要收據資訊，例如商家名稱、商家電話號碼、交易日期、稅金和交易總額。

如需收據處理模型的詳細資訊，請參閱使用預先建置的模型從收據擷取資訊。

敏感性信息處理

預先建置的敏感性信息處理模型會分析、偵測及擷取檔中的重要資訊。 API 會分析各種格式的合約，並擷取重要機密資訊，例如社會安全號碼、財務帳戶號碼、驅動程式授權標識碼和其他個人資訊。

如需敏感性信息處理模型的詳細資訊，請參閱使用預先建置的模型來偵測檔中的敏感性資訊。

簡單文件處理

預先建置的簡單文件處理模型提供彈性且預先定型的解決方案，可從基本結構化檔擷取索引鍵/值組、選取標記和具名實體。不同於其他具有固定架構的預先建置模型，此模型可以識別其他人可能會遺漏的索引鍵，提供自定義模型卷標和定型的寶貴替代方案。此模型也支援條碼和語言偵測。

如需簡單文件處理模型的詳細資訊，請參閱使用預先建置的模型來偵測檔中的敏感性資訊。

共用方式為