Freigeben über


SharePoint Server 2010에 대한 크롤링 삭제 정책 관리

SharePoint Server 2010에 대한 크롤링 삭제 정책 관리

안녕하세요. 엔터프라이즈 검색 사용자 지원 관련 문서 작성자인 Hal Zucati입니다. 이 문서에서는 SharePoint Server 2010에서 크롤링 삭제 정책을 관리하는 방법에 대한 몇 가지 정보를 제공합니다.

SharePoint Server 2010은 네 가지 정책을 사용하여 실수로 인한 콘텐츠 삭제를 제어합니다. 실수로 콘텐츠를 삭제하면 크롤링 중에 크롤링 구성 요소(크롤러)에 일시적인 오류가 발생합니다. 이러한 정책은 Search Service 응용 프로그램의 속성을 통해 제어되며, 연속 크롤링 시 항목 크롤링을 다시 시도하는 횟수와 시간을 결정합니다.

아래에는 이 네 가지 정책과 속성의 기본값(굵게 표시된 항목)이 설명되어 있습니다.


액세스 거부 또는 파일을 찾을 수 없음 오류 발생 시의 삭제 정책

크롤러에서 액세스 거부 또는 파일을 찾을 수 없음 오류가 발생하는 경우, 해당 오류가 ErrorDeleteCountAllowed개보다 많은 연속 크롤링에서 발생했으며 첫 번째 오류 이후의 기간이 ErrorDeleteIntervalAllowed시간보다 길면 인덱스 항목이 쿼리 구성 요소 검색 인덱스에서 삭제됩니다. 두 조건이 모두 충족되지 않으면 인덱스 항목에 대해 크롤링을 다시 시도합니다.

ErrorDeleteCountAllowed의 기본값은 30이고 ErrorDeleteIntervalAllowed의 기본값은 720시간(30일)입니다.


기타 모든 오류에 대한 삭제 정책

크롤러에서 액세스 거부 또는 파일을 찾을 수 없음 이외에 다른 유형의 오류가 발생하는 경우, 해당 오류가 ErrorCountAllowed개보다 많은 연속 크롤링에서 발생했으며 첫 번째 오류 이후의 기간이 ErrorIntervalAllowed시간보다 길면 항목이 검색 인덱스에서 삭제됩니다. 두 조건이 모두 충족되지 않으면 항목에 대해 크롤링을 다시 시도합니다.

ErrorCountAllowed의 기본값은 100이고 ErrorIntervalAllowed의 기본값은 1,440시간(60일)입니다.


SharePoint 콘텐츠에 대한 다시 크롤링 정책

이 정책은 SharePoint 콘텐츠에만 적용됩니다. RecrawlErrorCount개의 연속 크롤링에서 SharePoint 콘텐츠 데이터베이스의 변경 내용을 가져올 때 크롤러에서 오류가 발생했으며, 첫 번째 오류 이후의 기간이 RecrawlIntervalCount시간이면 크롤러에서 해당 콘텐츠 데이터베이스에 대해 크롤링을 강제로 다시 수행합니다.

RecrawlErrorCount의 기본값은 10이고 RecrawlIntervalCount의 기본값은 360시간(15일)입니다.


방문하지 않은 항목 삭제 정책

콘텐츠 원본을 전체 크롤링할 때 크롤러에서는 방문하지 않은 항목 삭제 단계를 실행합니다. 이 단계에서는 크롤링 기록에는 있지만 현재 전체 크롤링에서는 찾을 수 없는 항목이 삭제됩니다. 이 정책은 DeleteUnvisitedMethod 속성을 통해 노출되는데, 이 속성은 해당 단계 중에 삭제되는 항목을 결정합니다. 다음과 같은 세 가지 값을 사용할 수 있습니다.

  • DeleteUnvisitedMethod가 0이면 방문하지 않은 모든 항목을 삭제합니다.

  • DeleteUnvisitedMethod가 1(기본값)이면 콘텐츠 원본에 지정된 시작 주소와 호스트가 같은 방문하지 않은 항목은 유지되고, 다른 호스트에 대한 링크를 따라 이동하여 검색된 방문하지 않은 항목은 삭제됩니다.

  • DeleteUnvisitedMethod가 2이면 방문하지 않은 항목을 삭제하지 않습니다.

이러한 값을 보거나 변경하는 방법

 

이러한 각 속성 값은 SharePoint Server 2010용 Windows PowerShell을 사용하여 Search Service 응용 프로그램에서만 변경할 수 있습니다.

속성을 변경하려면

  1. 이 절차를 수행하는 컴퓨터에 대한 적절한 권한이 있는지 확인합니다.
  2. Windows 시작 메뉴에서 모든 프로그램으로 이동합니다.
  3. Microsoft SharePoint 2010 Products로 이동한 다음 SharePoint 2010 관리 셸을 클릭합니다.
  4. GET 명령을 사용하여 다음과 같이 원하는 검색 응용 프로그램 개체를 검색합니다. $SearchApplication = Get-SPEnterpriseSearchServiceApplication

현재 속성 값을 보려면 다음 명령을 사용합니다.

$SearchApplication.GetProperty("PropertyName")

속성의 값을 변경하려면 다음 명령을 사용합니다.

$SearchApplication.SetProperty("PropertyName", NewValue)

자세한 내용은 Get-SPEnterpriseSearchServiceApplication(https://technet.microsoft.com/ko-kr/library/ff608050.aspx)을 참조하십시오.

읽어 주셔서 감사합니다. 의견이 있으시면 댓글을 남겨 주십시오.

 

이 문서는 현지화된 블로그 게시물입니다. 원본 문서는 Managing crawl deletion policies for SharePoint Server 2010을 참조하십시오.