Udostępnij za pośrednictwem


사용자 지정 엔터티를 기반으로 한 구체화를 사용하여 검색 결과 탐색 향상

최초 문서 게시일: 2012년 12월 7일 금요일

대상: 검색 관리자/IT 전문가
선결 요건: 이 게시물은 독자가 기본적인 검색 관리 지식을 갖춘 것으로 가정합니다.

검색 결과를 쉽게 탐색하길 원하는 경우 문서에 이미 메타데이터가 있으면 이 메타데이터를 기반으로 구체화를 사용할 수 있습니다. 그러나 구체화에 사용할 메타데이터가 문서에 없는 경우 어떻게 해야 할까요? 이 경우에도 문서 콘텐츠에서 추출한 사용자 지정 엔터티를 기반으로 신속하게 검색 결과 범위를 좁혀 구체화를 만들 수 있습니다.

Contoso라는 조직에 여러 인증 이름을 가진 인증 프로그램이 있고 이러한 인증 이름을 기반으로 검색 결과를 구체하하려 한다고 합시다. 아래 단계에서는 문서의 본문과 제목에서 이러한 인증 이름을 추출하고 인증 이름을 기반으로 구체화를 만드는 방법을 보여 줍니다. 

1.       Contoso 인증 이름 목록이 포함된 .csv 파일을 만들고 PowerShell cmdlet Import-SPEnterpriseSearchCustomExtractionDictionary를 통해 이 사전을 가져옵니다.

다음은 예제 사전입니다.

이 사전을 통해 일치시킬 항목(Key)뿐만 아니라 구체화에 표시할 방법(Display form)도 지정할 수 있습니다. Display form을 사용하여 다양한 변형 이름을 하나의 표준 이름에 매핑할 수 있습니다. 이 예제에서 "Contoso Certified Master", "Contoso Certified Solutions Master" 등이 모두 "CCM"으로 표시되어 있습니다.

Windows PowerShell을 사용하여 사전을 가져오는 경우 사용자 지정 엔터티 추출기 유형을 정의해야 합니다. 선택하는 유형은 콘텐츠에서 엔터티를 일치시킬 방법에 따라 달라집니다. 단어 또는 단어 부분에 대한 대/소문자 구분 있는 일치 또는 대/소문자 구분 없는 일치를 수행할 수 있습니다. 이 예에서는 전체 단어에 대한 대/소문자 구분 없는 일치를 사용하려 하므로 Windows PowerShell cmdlet에서 Microsoft.UserDictionaries.EntityExtraction.Custom.Word.1을 지정하여 사용자 지정 단어 추출을 선택합니다. 콘텐츠가 공백으로 구분되지 않는 언어(예: 일본어)로 작성된 경우 단어 부분에 대한 일치를 사용해야 할 것입니다.

2.       문서 콘텐츠에 대한 사용자 지정 엔터티 추출을 사용하도록 설정합니다.

검색 스키마에서 구현할 사용자 지정 엔터티 추출기 유형을 사용하도록 설정하여 관리 속성 "body"와 "title"을 구성합니다. 이는 1단계에서 사전을 가져올 때 지정한 유형과 동일한 유형이어야 합니다. 

이 예의 경우 1단계에서 "Word Extraction - Custom1" 사전 유형을 가져왔기 때문에 이 유형을 사용하도록 설정합니다.

3.       문서 모음을 크롤링합니다.

사전을 가져오고 하나 이상의 관리 속성에 대한 사용자 지정 추출을 사용하도록 설정한 후에는 콘텐츠에 대한 전체 크롤링을 완료해야 합니다.

4.       새 Contoso 인증 구체화를 사용하도록 설정합니다.

사용자 지정 구체화를 사용하도록 검색 결과 페이지에서 구체화 웹 파트를 편집합니다.

 

다 되었습니다! 이제 검색 결과 페이지에 사용자 지정 엔터티 추출기를 기반으로 하는 구체화가 포함되어 있습니다.

 

 

자세한 내용은 https://technet.microsoft.com/ko-kr/library/jj219480.aspx에 있는 문서를 참조하십시오.

 

이 문서는 번역된 블로그 게시물입니다. 원본 문서는 Improve navigation through search results using refiners based on custom entities를 참조하십시오.