在 syntex 中建立擷取器時,利用字詞庫分類Microsoft
適用於: ✓ 非結構化文件處理
當您使用 Microsoft Syntex 在非結構化文件處理模型中建立擷取器時,您可以利用 字詞庫 中的全域字詞組,針對您擷取的數據顯示慣用字詞。
舉例來說,您的模型識別並分類上傳至文件庫的所有 [合約] 文件。 此外,模型也會從每個合約擷取 [合約服務] 值,並將它顯示在文件庫檢視的欄中。 在合於中的各種合約服務值中,貴公司已不再使用並重新命名了數個舊值。 例如,所有提及「設計」、「圖形」 或 「地形」 契约服務的條款現在都應該稱為「創造性」。 每當您的模型從合約檔中擷取其中一個過期的字詞時,您會希望它在文檔庫檢視中顯示目前的詞彙 Creative。 在下列範例中,在定型模型時,我們看到其中一個範例檔包含過時的「 設計」詞彙。
在擷取器中使用受控元數據數據行
字片組是在 SharePoint 系統管理中心的 [受控元數據服務] (MMS) 字詞庫中設定。 在下列範例中, 合約服務字詞組 已設定為包含數個字詞,包括 Creative。 它的詳細資料表明這個字詞有三個同義字(「設計」、「圖形」和「地形」),這些同義詞應該被翻譯成「創造性」。
您可能會想要在字詞組中使用同義字的原因有很多。 例如,可能存在過期字詞、重新命名的字詞或組織部門之間在命名方面的差异。
若要使受管理的中繼資料欄位可供您在模型中建立擷取器時使用,您需要將其添加為受管理的中繼資料網站欄。 新增網站欄後,您可以在建立模型擷取器時進行選取。
將模型套用至文件庫後,當文件上載到庫時,當擷取器找到任何同義字值(「設計」、「圖形」和「地形」)時,創意服務欄將顯示首選字詞(「創造性」)。
注意事項
如果字片語已開啟,則任何不符合慣用字詞或同義字值的擷取值,都會新增為字詞組根目錄的新字詞。 這些新字詞可以在字片語所在的字詞庫中移動、合併或成為同義字。