Partager via


SharePoint 2013의 검색 개요

최초 문서 게시일: 2012년 9월 29일 토요일

빠른 소개:
저는 SharePoint 조직에서 기업 내 정보 근로자의 검색 시나리오를 전문으로 다루고 있는 팀의 그룹 프로그램 관리자인 Gerhard Schobbe입니다.

릴리스 목적

먼저 이번 릴리스의 목적에 대해 설명드리겠습니다.

어떤 릴리스에서든 발전시키고자 하는 목표 영역이 존재합니다. Office 2013 릴리스에서 중요한 목표는 다음과 같습니다.

  • 단일 엔터프라이즈 검색 플랫폼으로 이동
  • 최종 사용자가 검색 시스템과 상호 작용할 수 있는 가시성이 뛰어난 기술적 발전 제공
  • 타사 개발은 물론 SharePoint의 다른 부분들을 포함하여 이 프로그램을 응용 프로그램의 보다 일반적인 액세스 계층으로 설정

여기에서는 이러한 각 목표에 대해 자세히 소개하면서 몇 가지 예를 통해 지금까지 이뤄낸 중요한 기술적 발전을 보여드리겠습니다. 이번의 개요 다음에는 향후 몇 주 및 몇 개월 내에 다양한 하위 시스템들에 대해 보다 자세히 설명하는 일련의 게시글들이 공개될 예정입니다.

단일 검색 플랫폼

먼저 단일 엔터프라이즈 검색 플랫폼이라는 목표에 대해 살펴보겠습니다. 2008년 인수한 FAST와 이후의 Office 2010 출시로 인해 Microsoft SharePoint 2010 제품군에는 서로 다른 기술 스택을 기반으로 하는 2계층 검색 시스템이 포함되었습니다. SharePoint 2010에는 Redmond에서 개발된 코드 기반에 준하는 엔터프라이즈 검색 시스템이 포함되며, 보다 상위 계층에는 인수로 인해 FAST 기술 스택을 기반으로 개발된 시스템인 FAST 검색 서버 2010이 포함됩니다.

하지만 두 가지 구현 중 최적의 성능을 조합할 수 있는 시스템이므로 모든 방면에서 보다 나은 엔터프라이즈 검색 제품을 제공하면서도, 고객의 선택을 간소화하고, 윈윈 환경을 제공할 것이 분명했습니다. 게다가 전체 아키텍처를 재고하는 과정 중에는 업데이트된 콘텐츠 및 쿼리 처리 프레임워크를 포함하여 아직 널리 출시되지 않은 FAST의 작동 기반이 되는 현대적인 구성 요소를 통합할 수 있는 기회도 얻을 수 있습니다.

이러한 계획에 따라 몇 년에 걸친 엔지니어링 작업이 수행된 후 차세대 콘텐츠 처리를 지원하는 SharePoint Search와 비슷한 크롤러 및 커넥터 프레임워크와 FAST 검색 기반의 검색 코어와 함께 작동하는 FAST의 쿼리 처리 프레임워크가 조합된 시스템이 구축되었습니다.

최종 사용자 및 IT 관리자를 위한 기본 사용자 환경은 다시 SharePoint에서 호스팅되며, SharePoint에서는 최종 사용자 환경이 2010의 서버 기반의 렌더링 접근 방식에서 비동기 클라이언트 쪽 접근 방식(이후 기능 추가)으로 완전히 재구성되었습니다.

또한 순위 지정 알고리즘 및 추천을 포함하여 다양한 작업에 대해 런타임으로 작동하는 새로운 분석 엔진을 통합할 수 있었습니다.
 
검색 플랫폼을 클라우드에서 호스팅하기 위해 많은 노력이 투입되었습니다. 이 기능의 최신 버전이 온라인으로 지원되면 O365 서비스를 지원하게 될 것입니다.
 
다음 그림에서는 이에 대한 요약 그림을 보여줍니다(확대하려면 이미지 클릭).

 

 

혁신적인 사용자 환경 만들기

 

 

이러한 노력은 모든 최종 사용자에게 혁신적인 향상 기능을 제공하기 위한 두 번째 투자 영역을 가져왔습니다. 기본적으로 사용자는 검색 센터 홈 페이지에서 검색어 집합을 입력합니다. 그리고 이러한 검색어 집합은 키워드로 처리되며, 결과는 세 줄의 요약과 간단한 메타데이터가 포함된 링크의 단일 순위 지정 목록으로 표시됩니다. 이러한 각 경우에 어떻게 다음 수준으로 이동할 수 있는지 설명드리겠습니다.

 

기본 진입점인 검색 센터 홈 페이지:

 

이번 릴리스에서 모든 팀 사이트의 모든 검색 상자에서는 기존의 범위 지정된 사이트 검색뿐만 아니라 기업 전반의 검색, 사용자 검색 및 기타 특별한 검색 환경에 대한 모든 액세스 기능을 제공합니다. 사용자는 검색 상자 내의 드롭다운 목록에서 원하는 범위에 액세스할 수 있습니다.

이러한 방식으로 팀 사이트에서 근무하거나 SharePoint 주위의 여러 허브 중 하나에서 근무하는 모든 사용자가 엔터프라이즈급 검색 환경을 이용할 수 있습니다. 

모든 용어가 키워드:

고객들에게서 허락을 받고 수집한 고객의 일부 쿼리 로그를 자세히 분석하자 많은 사용자 쿼리가 키워드명령 단어로 조합되었다는 것이 분명하게 드러났습니다. 명령 단어는 사용자가 찾고 있는 결과에 대한 유형을 나타낼 수 있습니다. 또 다른 대규모 쿼리는 예상 결과가 위치, 팀 사이트, 다른 웹 사이트, 문서 라이브러리 또는 심지어 사용자가 이미 몇 번 사용했던 특정 문서인 위치라는 점에서 탐색과 관련한 쿼리였습니다.

 

명령 단어의 개념을 확장하기 위해 "marketing deck"라는 예를 들어보겠습니다. 사용자는 명확히 마케팅에 대한 프레젠테이션을 찾고 있습니다. 하지만 "deck라는 단어가 포함된 프레젠테이션이 존재하지 않습니다. 이 단어는 단지 일반적으로 사용되는 관용구일 뿐입니다. 이 경우에는 쿼리의 용어를 실제 키워드(이 경우 "marketing")로 분류하고, 변환해야 하는 명령 단어를 쿼리의 다른 제약 조건(이 경우 결과 유형을 프레젠테이션으로 정의된 모든 파일 형식으로 제한하는 형식 제약 조건)으로 변환하는 것이 훨씬 효과적입니다. 예를 들어 사용자가 사이트에 대해 찾고 있는 힌트 또는 웹 페이지가 아닌 문서에 대해 찾고 있는 힌트에도 동일한 개념이 적용됩니다. 이러한 사고 과정을 통해 쿼리 용어를 키워드로 매핑하고 명령 단어를 속성 쿼리로 변환할 수 있게 해주는 쿼리 분석에 대한 일반화되고 확장 가능한 쿼리 분석 시스템이라는 쿼리 규칙이 소개되었습니다. 쿼리 규칙은 또한 사용자 동작을 활용한 결과 블록 만들기를 비롯한 고급 기능이 포함되어 있습니다. 쿼리 규칙을 수행할 수 있는 모든 항목들에 대한 자세한 내용은 이후의 추가 블로그 게시물에서 다뤄질 예정입니다.

결과에 대한 단일 순위 지정 목록:

 

쿼리 규칙에 따르면 동일 쿼리를 여러 가지로 해석하는 것이 허용됩니다. 한 가지 해석에서는 위 예에서의 형식 제한에 집중하여 문서 집합을 가져올 수 있으며, 다른 규칙은 Microsoft와 같은 회사에서 작업 범주 사전으로부터 잘 정의된 지침에 따라 "Marketing"에 대해 트리거될 수 있으므로 특히 각 지침에 대해 조심스럽게 현대화된 콘텐츠를 포함하는 회사 HR 저장소로 결과 집합의 범위를 다시 지정할 수 있습니다. 그리고 이러한 두 가지 해석이 모두 잘못되었고 인덱스에 대한 기존의 키워드 검색이 사용자가 원하는 올바른 결과를 표시하는 데 가장 적합한 기회를 포함한다고 가정하는 것이 효과적일 수도 있습니다. 세 가지 결과 집합을 단일 페이지로 다시 조합하면 결과 블록이라는 개념으로 이어집니다. 이러한 결과 블록은 개별 순위가 지정된 결과를 포함하는 각 블록에 대해 여러 위치에서 삽입되는 순위가 지정된 블록 집합으로 순위가 지정된 단일 개별 결과 목록을 증분합니다.

이러한 전체 영역에는 기본 개념의 성능을 보여주기 위해 보다 자세한 설명이 필요합니다.

다음 스크린샷에서는 "marketing deck"라는 쿼리로 "marketing" 쿼리와 일치하는 "decks"(프레젠테이션) 포함 블록과 전체 쿼리에 대한 일반 결과를 예로 보여줍니다.

 

3줄 요약의 링크:

 

화면에서 사용 가능한 동일한 픽셀 공간에 단순히 더 많은 정보를 채워 넣으려는 시도로는 가장 적합한 항목을 빠르게 찾기 위해 여러 결과를 조사하는 사용자의 기능 측면에서 봤을 때 올바른 기능 개선을 얻을 수 없다는 것이 분명했습니다. 이에 대한 해결책으로는 사이트, 문서 및 대화에 대한 시각적 미리 보기를 표시하기 위해 더 크게 확장할 수 있는 호버 패널이 선택되었습니다. 또한 호버 패널을 통해서는 문서 또는 웹 페이지를 읽기 위해 암시적으로 단방향으로 디자인된 환경으로부터 사용자가 검색 결과에서 직접 수행할 수 있는 확장 가능한 일련의 작업 환경으로 확장할 수 있는 가능성을 얻을 수 있었습니다. 예를 들어 문서를 따라 편집 모드로 바로 이동하거나, 문서가 저장된 라이브러리를 공유하거나 열어서 사용 가능한 다른 콘텐츠를 확인하는 등의 작업이 가능하며, 이러한 작업은 단지 기본 작업 중 일부일 뿐입니다.

마지막으로 저희는 텍스트 요약만 사용하는 대신 호버 패널 내에서 강력한 "세부 링크"로 표시되는 여러 문서 유형들에 대한 의미 섹션을 추출할 수 있도록 했습니다. 파일 이름은 특별히 설명적이지 않더라도 PowerPoint 프레젠테이션의 슬라이드 제목은 발표자가 특별히 각 슬라이드의 내용을 요약하도록 신중하게 결정하기 때문입니다.

이제는 키워드에 대한 응답으로 슬라이드 제목을 추출해서 표시할 수 있으며, 사용자는 인덱스에서 1억 개 이상의 항목에 대한 쿼리를 수행해서 관련 제목이 포함된 단일 슬라이드를 찾아서 확대하고, 단일 클릭으로 해당 프레젠테이션의 특정 슬라이드를 정확하게 열어 볼 수 있습니다. 이 기능은 또한 SharePoint 사이트(최상위 하위 사이트 및 문서 라이브러리)는 물론 Word 문서와 Excel 문서(특히 그래프 및 이름이 지정된 테이블)에서도 사용할 수 있습니다.
 
이러한 모든 새로운 기능을 지원하는 UI 프레임워크는 새롭게 디자인되었습니다. 이 UI 프레임워크는 보다 간편한 확장성을 위해 JavaScript 및 HTML로 정의된 중첩된 레이아웃 템플릿 집합을 기반으로 합니다. 모든 결과 유형에는 결과 목록에서 레이아웃을 제어하기 위한 템플릿과 호버 패널 템플릿이 포함됩니다. 이러한 모든 템플릿은 원하는 프레젠테이션 레이아웃에 맞게 조정할 수 있습니다. 이에 대한 한 가지 예로 기본적으로 포함된 비디오 검색은 비디오 결과를 제공하기 위해 사용자 지정된 결과 레이아웃을 포함하는 그리드 레이아웃을 사용합니다. 단순히 템플릿만 변경해도 상당히 다른 모양의 결과를 얻을 수 있으며, 기본 결과 웹 파트에 대한 코드 변경은 필요하지 않습니다.

이러한 향상된 기능들이 모두 모여 SharePoint의 어디에서나 액세스할 수 있으며, 사용자 쿼리를 보다 효과적으로 이해하고, 사이트 및 문서 내부에서 가장 세부적인 정보까지 직접적으로 액세스할 수 있으며, 사용자가 결과 페이지를 떠나지 않고도 결과에 대해 작업을 수행할 수 있게 해주는 매우 강력하고 응답성이 뛰어난 사용자 환경을 만들었습니다.

다음 그림에서는 파일 내부의 관련 슬라이드 제목에 대한 링크, 사용자가 덱을 통해 대화형으로 페이지를 이동할 수 있게 해주는 시각적인 미리 보기, 패널 아래에 있는 작업 링크 집합 등 PowerPoint 프레젠테이션에서 이러한 기능과 환경을 어떻게 이용할 수 있는지에 대한 예를 보여줍니다.



정보 액세스 플랫폼으로서의 검색

세 번째 목표는 검색 플랫폼을 보다 일반화된 정보 액세스 플랫폼으로 구성하는 것입니다.
올바르게 구성된 엔터프라이즈 검색 인덱스는 기업 내에서 제공되는 놀라운 정보 컬렉션을 포함합니다. 이러한 정보 컬렉션은 서로 다른 문서 관리 시스템의 정보 사일로 한계를 뛰어넘고 이러한 시스템 간의 메타데이터 스키마를 정규화합니다.

이러한 모든 정보는 대화형의 키워드 기반 사용자 환경으로 제공하는 것도 좋지만, 여기에서 멈출 이유가 있을까요? 기본 사일로의 경계를 무시하고 가장 적합한 항목을 가장 먼저 표시하기 위해 콘텐츠 키워드 기반 일치 및 순위 지정의 이점을 활용하는 사용자 중심의 보기를 하나로 묶음으로써 효과를 볼 수 있는 정보 환경은 매우 다양합니다.

이러한 환경을 설명하기 위해 저는 SharePoint 2013에 기본적으로 포함된 몇 가지 예를 보여드리고자 합니다.

  • MySites에서는 사용자가 사이트에 관계없이 자신에게 지정된 모든 SharePoint 작업의 목록에 액세스할 수 있습니다.
  • 모든 문서 라이브러리의 상단에는 이제 사용자가 메타데이터 및 해당 문서의 전체 텍스트 간에 검색을 수행할 수 있는 검색 상자가 포함되며, 결과 목록은 결과 페이지가 아니라 표준 SharePoint 보기로 제공됩니다.
  • 게시글 또는 토론에서 해시 태그를 클릭하면 기업 전체에서 해당 항목에 대한 모든 대화 목록이 표시됩니다.

이 릴리스에서는 규칙 기반의 새로운 형식 정의 방법(예: 계약서는 일반적인 파일 형식인 "Word"와 다른 형식이어야 함), UI 및 XRANK를 통해 조정 가능한 보다 효과적인 기본 관련성, SharePoint 및 Exchange를 포함하는 전자 검색, 콘텐츠를 보다 최신 상태로 유지할 수 있게 해주는 지속적인 크롤링, O365 테넌시의 결과를 "하이브리드" 구성의 온-프레미스 결과와 조합할 수 있는 기능 등 매우 많은 새 기능들이 제공됩니다. 그리고 시스템에서도 이제 CSOM 및 RESTful API 등 다양한 형식이 제공됩니다.

 

이 문서가 도움이 되셨기를 바랍니다. O365 Preview 환경 온라인(영문일 수 있음)에 등록하거나 여기(영문일 수 있음)에서 다운로드하여 로컬 컴퓨터에 설치하시기 바랍니다.

의견이 있으면 언제라도 알려주십시오!
 
G.

이 문서는 번역된 블로그 게시물입니다. 원본 문서는 Overview of Search in SharePoint 2013을 참조하십시오.