SharePoint 2010에서 크롤링 문제를 디버그하기 위한 문제 해결 팁
최초 문서 게시일: 2011년 5월 1일 일요일
최근 SharePoint 2010 크롤링 중에 발생한 몇 가지 인증 문제를 디버그하면서 매우 유용한 문제 해결 방법을 발견했습니다. 이 과정에서 몇 가지 오류가 발생했으며, 크롤링 로그에서도 또 다른 문제가 발생하여 필요한 정보를 가져오기도 어려웠습니다. 결국 Fiddler(www.fiddler2.com(영문일 수 있음))를 통해 문제를 해결할 수 있었습니다.
Fiddler를 잘 모르는 분도 계실 것이므로 여기서는 Fiddler에 대해 설명하지 않겠습니다. 제 경우에는 Fiddler를 사용하여 크롤링 중에 발생하는 오류를 캡처하는 방식으로 문제를 해결했습니다. Fiddler를 크롤링 계정에 대한 역방향 프록시로 설정하면 이 작업을 매우 간단하게 수행할 수 있습니다. Fiddler를 역방향 프록시로 구성하는 지침은 https://www.fiddler2.com/Fiddler/help/reverseproxy.asp(영문일 수 있음)에서 확인할 수 있습니다. 제가 사용한 방법은 다음과 같습니다.
- 크롤링 계정으로 크롤링 서버에 로그인합니다.
- 위에서 설명한 것처럼 Fiddler를 역방향 프록시로 구성합니다.
- Fiddler를 시작합니다.
- 새 크롤링을 시작합니다.
이 과정에서 문제가 발생하는 사이트를 별도의 콘텐츠 원본으로 분리했습니다. 따라서 이 단계를 수행하고 나면 크롤러에서 해당 콘텐츠 원본으로의 각 요청, 인증 방법, 그리고 발생하는 상황을 확인할 수 있었습니다. 전반적으로 볼 때 이 방법은 사이트 크롤링 중에 발생하는 상황을 보다 명확하게 파악하는 데 매우 유용했습니다.
이 문서는 번역된 블로그 게시물입니다. 원본 문서는 Troubleshooting Tip for Debugging Crawl Issues in SharePoint 2010을 참조하십시오.