使用爬网日志
爬网日志跟踪已爬网内容的相关状态信息。利用此日志可以验证是否已向索引成功添加了已爬网内容、已爬网内容是否因某个爬网规则而被排除或索引编制是否因某个错误而失败。其中还记录了有关已爬网内容的其他信息,包括上次成功爬网的时间、内容源(可能多于一个)、所使用的内容访问帐户以及是否应用了爬网规则。
还可以对爬网日志应用筛选器,以控制所显示的数据。这样可以更容易地管理对爬网日志的使用,因为应用筛选器可以仅显示所关注的数据,无须浏览所有数据就能找到所需内容。
爬网日志对象模型
可以在位于 Microsoft.Office.Server.Search.dll 的 Microsoft.Office.Server.Search.Administration 命名空间中找到爬网日志类。
可以使用 LogViewer 对象检索爬网日志数据。利用 LogViewer 对象的 MaxDaysCrawlLogged 属性,可以设置爬网日志保留数据的最大天数。
爬网日志数据
若要操作爬网日志中的数据,请使用 CrawlLogFilters 对象,该对象包含用于此目的的所有筛选器。此对象包含 AddFilter 方法及四个重载,利用它们可以为以下内容添加筛选器:
所有整数属性(如 startAt、TotalEntries 和 MessageId)
日志时间
消息类型
URL
See Also
参考
Microsoft.Office.Server.Search.Administration.LogViewer
Microsoft.Office.Server.Search.Administration.CrawlLogFilters