Microsoft Syntex 추출기를 만들 때 용어 저장소 분류 활용
적용 대상: ✓ 비정형 문서 처리
Microsoft Syntex 사용하여 구조화되지 않은 문서 처리 모델에서 추출기를 만들 때 용어 저장소의 전역 용어 집합을 활용하여 추출한 데이터에 대한 기본 용어를 표시할 수 있습니다.
예를 들어, 모델은 문서 라이브러리에 업로드 되는 모든 계약서를 식별하고 분류합니다. 또한 모델은 각 계약에서 Contract Service 값을 추출하여 라이브러리 보기의 열에 표시합니다. 계약서의 다양한 계약 서비스에는 회사가 더 이상 사용하지 않고 이름이 변경 된 여러가지 이전 값이 있습니다. 예를 들어 디자인, 그래픽 또는 지형 계약 서비스에 대한 모든 참조는 이제 창의성이라고 불립니다. 모델이 계약 문서에서 오래된 용어 중 하나를 추출할 때마다 라이브러리 보기에 현재 용어인 Creative를 표시하려고 합니다. 다음 예제에서는 모델을 학습하는 동안 하나의 샘플 문서에 오래된 디자인 용어가 포함되어 있음을 확인합니다.
추출기에서 관리되는 메타데이터 열 사용
용어 집합은 SharePoint 관리 센터의 MMS(Managed Metadata Services) 용어 저장소에 구성됩니다. 다음 예제에서 Contract Services용어 집합 은 Creative를 비롯한 여러 용어를 포함하도록 구성 됩니다. 세부 내역에는 용어에 세 가지의 동의어(디자인, 그래픽 및 지형)가 있다고 보여주며 이 동의어는 창의성이라고 해석되어야 합니다.
용어 집합에서 동의어를 사용하는데는 여러 이유가 있습니다. 예를 들어, 이름을 지을 때 예전에 사용된 용어, 이름이 바뀐 용어 혹은 조직 부서간에 다르게 사용되는 용어가 있을 수 있습니다.
모델에서 추출기를 만들 때 관리되는 메타데이터 필드를 선택하도록 하려면 관리되는 메타데이터 사이트 열로 추가해야 합니다. 사이트 열을 추가한 후 모델에 대한 추출기를 만들 때 선택할 수 있습니다.
문서 라이브러리에 모델을 적용 한 후 문서가 라이브러리에 업로드 되면 추출자가 동의어 값(디자인, 그래픽, 및 지형)을 찾으면 창의성 서비스 칼럼이 기본 용어(창의성)로 보여집니다.
참고
용어 집합이 열려 있으면 기본 설정 용어 또는 동의어 값과 일치하지 않는 추출된 값이 용어 집합의 루트에 새 용어로 추가됩니다. 이러한 새 용어는 용어 집합이 있는 용어 저장소에서 이동, 병합 또는 동의어를 만들 수 있습니다.