Microsoft Syntex 中預先建置的文件處理概觀

注意事項

到 2025 年 6 月，如果您已設定隨用隨付計費，您可以免費試用有限數量的預建文件處理和其他選取的 Syntex 服務。如需相關信息和限制，請參閱試用 Microsoft Syntex 並探索其服務。

除了自定義模型之外，Microsoft Syntex 還提供預先建置的模型，以自動擷取資訊。

注意事項

Microsoft尊重您用來在 Syntex 中定型和處理模型之數據的隱私權和擁有權。 Microsoft不會使用或傳輸貴組織的任何數據來訓練 AI 模型、大型語言模型或任何其他模型。您的數據會安全地保留在組織的租用戶內。如需詳細資訊，請參閱Microsoft數據保護和隱私權。

預建模型簡介

預先建置的文件處理會使用預先設定的預先建置模型來辨識檔和檔中的結構化資訊。不必從頭開始建立新自訂模型，您可以重複現有的預先訓練模型，以新增符合組織需求的特定欄位。

預建模型使用光學字元辨識 (OCR) 與深度學習模型結合，以識別並擷取特定文件類型常用的預先定義文字和資料欄位。首先請根據預建模型分析您的其中一個檔案。然後選取適合您用途的已偵測欄位。如果模型未偵測到您需要的欄位，您可以使用不同的檔案再次分析。

如同其他模型，預先建置的模型會在內容中心內建立和管理。當套用至 SharePoint 文件庫時，模型與一個內容類型相關聯，且具有儲存所擷取資訊的欄標籤。

發佈模型之後，請使用內容中心將它套用到您有權存取的任何 SharePoint 文件庫。

目前有五種預先建置的處理模型可供使用：合約、發票、收據、敏感性資訊和簡單檔。

合約。 預先建置的 合約處理模型 會分析並擷取合約檔中的重要資訊。 API 會以各種格式分析合約，並擷取密鑰合約資訊，例如用戶端名稱和地址、合約持續時間和續約日期。
發票。 發票處理模型會分析並擷取銷售發票中的密鑰資訊。 API 會以各種格式分析發票，並擷取重要的發票資訊，例如客戶名稱、帳單位址、到期日和到期金額。
回條。 收據處理模型會分析和擷取銷售收據中的重要資訊。 API 會分析列印和手寫收據，並解壓縮重要收據資訊，例如商家名稱、商家電話號碼、交易日期、稅金和交易總額。
敏感性資訊。 敏感性資訊模型會分析、偵測及擷取檔中的重要資訊。 API 會分析各種格式的檔，並偵測和擷取重要機密資訊，例如個人和財務標識符、實體和電子郵件位址，以及電話號碼。
簡單檔。 簡單文件處理模型提供彈性且預先定型的解決方案，可從基本結構化檔擷取索引鍵/值組、選取標記和具名實體。此模型也支援條碼和語言偵測。

未來版本將會提供其他預建模型。

如需選擇此模型時要考慮之需求的相關信息，請參閱 Microsoft Syntex 中模型的需求和限制。