内容源概述
对于 Microsoft Office SharePoint Server 2007 企业级搜索,内容源代表应由搜索服务爬网的内容以及该内容源爬网配置的相关信息。爬网配置与 Microsoft Office SharePoint Portal Server 2003 Search 相同;但是内容源的工作方式以及用来配置他们的类有一些变化。
下面是较大改动:
现在,允许为单个内容源使用多个开始地址。这减少了所需内容源的数量,因此可简化内容源管理。
默认情况下,在 Search 中配置内容源,即“本地 Office SharePoint Server 网站”内容源。此内容源包括服务器或服务器场内的网站中存储的所有内容以及用户配置文件。
添加了两个新内容源类型:
SharePointContentSource 此类型可简化 SharePoint 网站的内容源配置过程,只需指定开始地址即可。SharePointContentSource 类型在设计上能够自动在爬网中包含或排除适当的内容,且无需额外的配置。
BusinessDataCatalogContentSource 此类型允许您配置企业级搜索,从后端服务器应用程序爬网内容,如 SAP 或 Siebel。要使用该内容源,您必须首先配置业务数据目录来访问后端服务器应用程序中的数据。有关详细信息,请参阅业务数据目录。
内容源对象模型
企业级搜索Microsoft.Office.Server.Search.Administration 命名空间包含几个代表内容源对象模型中不同内容源类型的类,如下图中所示。
下表描述各内容源类型。
内容源类型 |
备注 |
---|---|
ContentSource |
所有内容源类型的基类。 |
WebContentSource |
用于包含 Web 内容。 |
SharePointContentSource |
包括所有 Windows SharePoint Services 内容。 |
BusinessDataContentSource |
用于包含在业务数据目录中配置的应用程序中的内容。 |
HierarchicalContentSource |
基类。 |
FileShareContentSource |
用来包含文件共享内容。 |
ExchangePublicFolderContentSource |
用来包含 Microsoft Exchange Server 公用文件夹内容。 |
LotusNotesContentSource |
用于包含 Lotus Notes 内容。默认情况下没有配置。 |
CustomContentSource |
用于包含自定义内容源中的内容。 |
计划爬网
爬网计划链接到内容源,因此可使用内容源类管理特定内容集的爬网计划。
若要为内容源配置爬网计划,您可以选择从四种计划。(所有计划从都继承自 Schedule 基类)。
DailySchedule 用于指定爬网间隔的天数。
WeeklySchedule 用于指定爬网间隔的星期数。
MonthlySchedule 用于指定应该发生爬网的月份和日期。
MonthlyDayOfWeekSchedule 用于指定应该发生爬网的月份、周和日期。