使用爬網範圍管理器
爬網範圍管理員 (CSM) 是一組介面,提供方法,以通知 Windows 搜索引擎哪些容器需要爬網,以及哪些專案應包含在目錄中或從這些容器中排除。 開發人員可以使用 CSM,以程式設計方式定義新資料存放區或通訊協定處理程式的編目範圍。 系統管理員可以使用 CSM 來檢視所有使用者的索引、搜尋根目錄和範圍規則。
本節的組織方式如下:
什麼是爬行範圍管理器?
若要瞭解爬行範圍管理員,您必須瞭解下列術語:
- 搜索範圍 是一組 URL,這些 URL 指向數據存放區或容器(如電子郵件數據存放區、資料庫、網路檔案共用等),用於索引項目的抓取。 對於階層式數據存放區,編目範圍可以包含父 URL,但排除子 URL,反之亦然。 編目範圍內的專案會編製索引;系統會忽略編目範圍以外的專案。
- 搜尋根目錄 是識別與特定通訊協定處理程式相關聯的容器或數據存放區的最上層 URL。 搜尋根目錄可以識別特定用戶的位置、位於遠端電腦上的位置,或符合通配符模式的位置。 當您新增數據存放區或通訊協定處理程式時,也應該將搜尋根目錄新增至編目範圍。
- 範圍規則 是一項規則,用於決定在搜尋根目錄中包含或排除的 URL 是否會被爬取和索引。 例如,假設您想要在 ProjectFiles 資料夾內建立索引的所有內容,但不包括子資料夾 Prototypes。 您需要 file:///C:\WorkteamA\ProjectFiles\ 的包含規則,以及 file:///C:\WorkteamA\ProjectFiles\Prototypes\的排除規則。
編目範圍管理員 (CSM) 是一組 API,可讓您新增、移除和列舉 Windows 搜尋索引器搜尋根和範圍規則。 當您想要讓索引器開始搜尋一個新的容器時,可以使用 CSM 設定搜尋根目錄及根目錄內路徑的範圍規則。 例如,如果您安裝新的通訊協定處理程式,您可以建立搜尋根目標,並新增一或多個包含規則,然後索引器可以啟動初始索引編製的爬行。 CSM 提供下列介面,可協助您以程式設計方式執行這項作業。
- IEnumSearchRoots
- IEnumSearchScopeRules
- ISearchCrawlScopeManager
- ISearchCrawlScopeManager2
- ISearchRoot
- ISearchScopeRule
- ISearchItem
雖然您可以使用 CSM API 以程式設計方式定義編目範圍,但 CSM 也是為了支援終端用戶而設計。 例如,假設您已為新的資料存放區開發通訊協定處理程式,而您想要讓使用者或系統管理員管理應編製索引的路徑。 您可以使用編目範圍管理員來設定一或多個搜尋根目錄(例如,file:///C:\MyContainer\),而設定索引選項的 Windows 搜尋使用者介面將會顯示每個搜尋根目錄都有複選框。 然後,使用者可以包含或排除該路徑或其子目錄。
搜尋根源和範圍規則
搜尋根和範圍規則一起定義組成索引器編目範圍的一組工作 URL。
搜尋根目錄
設定搜尋根目錄不會指定此存放區的哪些部分應編製索引;它只會發出內容存放區存在且與已註冊通訊協定處理程式相關聯的訊號。 搜尋根目錄的語法包括通訊協定、網站或使用者安全性識別碼,以及要爬行的位址的路徑。
您應該在下列情況下建立新的搜尋根目錄:
- 安裝通訊協議處理程式 OR
- 想索引新的數據存放區
和
- 該數據存放區尚未位於索引器編目範圍中。
如需新增、移除和列舉搜尋根目錄的指示,請參閱 管理搜尋根。
範圍規則
範圍規則包含或排除搜尋根目錄中的 URL,使其無法進行編目和編製索引。 範圍規則可由終端使用者、組策略或第三方開發人員設定。 當您定義新的搜尋根目錄時,應該以程式設計方式定義範圍規則。 您的搜尋根和範圍規則會組成數據存放區和通訊協定處理程式的預設編目範圍。
注意
具有控制面板存取權的使用者可以修改預設爬網範圍。 因此,任何提供範圍管理的應用程式都應該使用 列舉方法直接從 CSM 取得規則,而不是依賴其本身儲存的使用者規則複本。
如需新增、移除、還原和列舉範圍規則的指示,請參閱 管理範圍規則。
編目範圍管理員支援的組策略
系統管理員可以使用組策略定義整個組織的編目範圍。 這些組策略規則也可以做為默認規則,用戶可以覆寫這些規則。 例如,您可以為一組用戶編製索引的目錄,併為另一組用戶設定不同的目錄,讓使用者取消選取這些預設值。 例如,組策略規則也可以做為用戶無法覆寫的強制排除規則,防止特定用戶編製特定網路共用的索引。
相關主題