共用方式為


Microsoft Syntex 中的模型類型概觀

適用於: ✓ 所有自定義模型 |✓ 所有預先建置的模型

瞭解 Microsoft Syntex 中的內容是從文件處理模型開始。 文件處理模型可讓您識別並分類上傳至 SharePoint 文檔庫的檔,然後從每個檔案擷取所需的資訊。

當套用至 SharePoint 文件庫時,模型與一個內容類型相關聯,且具有儲存所擷取資訊的欄標籤。 您建立的內容類型儲存在 SharePoint 內容類型庫中。 您也可以選擇使用現有內容類型來使用其架構。

Syntex 使用 自定義模型預先建置的模型

顯示 Syntex 自定義和預建模型類型的圖表。

模型可以是在內容中心建立的企業模型,或是在本機 SharePoint 網站上建立的本機模型

自訂模型

您選擇的自定義模型類型取決於您使用的檔案類型、檔案的格式和結構,以及您要套用模型的位置。

自訂模型包括:

若要檢視自定義模型中的並存差異,請參閱 比較自定義模型

非結構化文件處理

使用非結構化文件處理模型自動分類檔,並從中擷取資訊。 它最適用於非結構化文件,如信件或合约。 這些文件必須具有可根據片語或模式識別的文字。 所識別的文字指定了檔案的類型(它的分類)和您想要擷取的內容(它的擷取器)。

例如,非結構化文件可以是可以用不同方式撰寫的合同續約函。 不過,資訊會一致地存在於每個合約續約檔的本文中,例如文字字串 “Service start date of” 後面接著實際日期。

此模型類型支援最廣泛的檔類型,並支持 超過40種語言

當您建立非結構化文件處理模型時,請使用 [單一類別模型 ] 選項。

如需詳細資訊,請參閱 非結構化文件處理概觀

手繪多邊形文件處理

使用手繪多邊形文件處理模型,從非結構化和手繪多邊形文件自動擷取資訊,例如字母和合約,其中資訊可以出現在檔中的任何位置。

手繪多邊形文件處理模型會使用 Microsoft Power Apps AI Builder 在 Syntex 中建立和定型模型。

注意事項

手繪多邊形文件處理模型尚無法在某些區域中使用。 如需詳細資訊,請參閱 依區域的功能可用性

因為貴組織會從各種來源接收大量信件和檔,例如郵件、傳真和電子郵件,所以處理這些檔並手動將其輸入資料庫可能需要相當長的時間。 藉由使用 AI 從這些檔擷取文字和其他資訊,此模型會將此程式自動化。

當您不需要自動分類檔類型,且支持 超過 40 種語言時,此模型類型是 PDF 或影像檔中檔的最佳選項。

當您建立手繪多邊形文件處理模型時,請使用 [手繪多邊形擷取模型] 選項。

如需詳細資訊,請參閱 結構化和手繪多邊形文件處理概觀

結構化文件處理

使用結構化文件處理模型自動識別欄位和數據表值。 最適合結構化或半結構化的檔,例如表單和發票。

結構化文件處理模型會使用Microsoft Power Apps AI Builder 檔處理 (先前稱為表單處理) ,以在 Syntex 中建立和定型模型。

此模型類型支援 最廣泛的語言, 並已定型以從範例文件了解表單的版面配置,然後學習尋找從類似位置擷取所需的數據。 Forms 通常會有更結構化的配置,其中實體位於相同的位置 (例如,稅務窗體上的社會安全號碼) 。

當您建立結構化文件處理模型時,請使用 [結構化擷取模型 ] 選項。

如需詳細資訊,請參閱 結構化和手繪多邊形文件處理概觀

預先建立的模型

如果您不需要建置自定義模型,您可以使用已針對特定結構化檔定型 的預先建置文件處理模型

預先建置的模型包括:

預建模型已預先訓練能識別文件和文件中結構化的資訊。 不必從頭開始建立新自訂模型,您可以重複現有的預先訓練模型,以新增符合組織需求的特定欄位。

合約處理

預先建置的合約處理模型會分析並擷取合約檔中的重要資訊。 API 會分析各種格式的合約,並擷取密鑰合約資訊,例如用戶端或合作物件名稱、帳單地址、管轄權和到期日。

如需合約處理模型的詳細資訊,請 參閱使用預先建置的模型從合約擷取資訊

發票處理

預先建置的發票處理模型會分析並擷取銷售發票中的密鑰資訊。 API 會以各種格式分析發票,並擷取重要的發票資訊,例如客戶名稱、帳單位址、到期日和到期金額。

如需發票處理模型的詳細資訊,請 參閱使用預先建置的模型從發票擷取資訊

收據處理

預先建置的收據處理模型會分析並擷取銷售收據中的重要資訊。 API 會分析列印和手寫收據,並解壓縮重要收據資訊,例如商家名稱、商家電話號碼、交易日期、稅金和交易總額。

如需收據處理模型的詳細資訊,請 參閱使用預先建置的模型從收據擷取資訊

敏感性信息處理

預先建置的敏感性信息處理模型會分析、偵測及擷取檔中的重要資訊。 API 會分析各種格式的合約,並擷取重要機密資訊,例如社會安全號碼、財務帳戶號碼、驅動程式授權標識碼和其他個人資訊。

如需敏感性信息處理模型的詳細資訊,請 參閱使用預先建置的模型來偵測檔中的敏感性資訊

簡單文件處理

預先建置的簡單文件處理模型提供彈性且預先定型的解決方案,可從基本結構化檔擷取索引鍵/值組、選取標記和具名實體。 不同於其他具有固定架構的預先建置模型,此模型可以識別其他人可能會遺漏的索引鍵,提供自定義模型卷標和定型的寶貴替代方案。 此模型也支援條碼和語言偵測。

如需簡單文件處理模型的詳細資訊,請 參閱使用預先建置的模型來偵測檔中的敏感性資訊