編目內容 (Office SharePoint Server 2007)
編目內容是系統存取並剖析內容及其屬性 (有時稱為中繼資料),以建立可處理搜尋查詢的內容索引之程序。
若能成功將內容編目,編目程式就能存取及讀取想要供其搜尋查詢的個別檔案或內容組件。這些檔案的關鍵字和中繼資料會儲存在內容索引中,有時稱為索引。索引由儲存在索引伺服器之檔案系統的關鍵字,以及儲存在搜尋資料庫的中繼資料所組成。系統會維護以下三者之間的對應:關鍵字、與個別內容組件相關聯的中繼資料,以及用以將內容編目的來源 URL。
注意
編目程式不會變更主機伺服器上的檔案。反之,會對主機伺服器上的檔案進行存取、讀取,而那些檔案的文字和中繼資料會傳送到索引伺服器,以編製索引。但是,因為編目程式會讀取主機伺服器上的內容,所以主控特定內容來源的某些伺服器可能會更新所編目之檔案的最新存取日期。
決定何時要編目內容
伺服器陣列已部署並執行一些時間之後,搜尋服務管理員通常必須變更編目排程。可能需要進行此動作的原因如下:
配合停機時間和流量尖峰期的變更。
配合主控內容的伺服器上之內容更新頻率的變更。
排程編目,讓:
較慢的主機伺服器上所主控內容的編目,與較快的主機伺服器上所主控內容的編目分開執行。
編目新的內容來源。
編目的頻率與目標內容的更新頻率一樣。例如,您可能想要對每天更新的存放庫執行每日編目,並對不常更新的存放庫執行較不頻繁的編目。
執行編目
一般而言,會排程編目以自動化大部分作業。不過,有時候可能想要以手動方式啟動編目。例如,您可能會啟動編目以套用管理變更 (例如,所編目和索引之內容的編目規則),或決定是否已解決編目記錄檔中的錯誤。
除此之外,不論是透過排程或手動啟動編目,都可能會需要停止或暫停一或多個編目。例如,其伺服器主控您所編目之內容的管理員可能會通知您,編目對伺服器的負載太重;或者,可能提醒您所編目的地伺服器目前離線。在上述任一情況下,皆可能會想要停止或暫停編目。
請注意,執行完整編目會比執行累加編目需要更多的時間和伺服器資源。完整編目:
在索引伺服器上耗用的記憶體和 CPU 週期多於累加編目。
在編目伺服器陣列中的內容時,會在前端網頁伺服器上耗用較多的記憶體和 CPU 週期。這不適用於伺服器陣列外部的內容。
使用的網路頻寬多於累加編目。
重要
如果您停止編目任何內容來源,則在下次編目該內容來源時,Microsoft Office SharePoint Server 2007 會自動執行該內容來源的完整編目。這也適用於嘗試執行累加編目時。因此,請謹慎考量是否應該暫停編目,而不是停止編目。
因為每個暫停的內容來源都會耗用索引伺服器上的記憶體和 CPU 資源,所以您也必須小心不要同時暫停太多內容來源的編目。
若要啟動完整或累加編目、停止、暫停或繼續編目,請執行下列其中一個程序:
排程編目
下列章節提供有關考慮以排程方式編目內容的詳細資訊。
停機時間和尖峰流量期間
請針對主控您要編目的內容之伺服器,考慮伺服器的停機時間和尖峰流量時間。例如,若您編目的內容是由伺服器陣列外的許多不同伺服器所主控,這些伺服器可能是依不同的排程備份;流量尖峰時間也不同。管理伺服器陣列以外的伺服器,通常不在您的控制內。因此,建議您與裝載您要編目的內容的伺服器管理員協調您的編目,確保您不會在停機時間或尖峰流量期間編目他們伺服器上的內容。
注意
因為主機伺服器的尖峰流量時間和停機時間可以變更,所以建議您定期重新評估所有內容來源的編目排程,而不只是新建立的排程。
常見的情況就是牽涉到不在組織控制內且與 SharePoint 網站內容有關的內容。您可以將此內容的起始位址加入現有的內容來源,或是為外部內容建立新的內容來源。由於外部網站的可用性會有很大的差異,因此,為不同的外部內容加入個別的內容來源會很有幫助。如此一來,您可以在與其他內容來源不同的時間,編目外部內容的內容來源。然後,您就可以根據編目排程來更新對於每個網站之可用性有意義的外部內容。
經常更新的內容
在規劃編目排程時,請考量有些內容來源的更新頻率會比其他內容來源高。例如,如果您知道某些網站集合或外部來源的內容只在星期五更新,則每週編目內容超過一次就會浪費資源。然而,您的伺服器陣列可能含有星期一到五都不斷更新,但通常不在星期六和星期日更新的其他網站集合。在此情況下,您可能會想要在一週多次編目這些網站,而週末則根本不進行編目。
在您的環境中跨網站集合儲存內容的方法,可以指導您在各 Web 應用程式中為各網站集合建立其他內容來源。例如,若網站集合只儲存封存的資訊,則編目內容的頻率就不需要像儲存經常更新內容的網站集合那麼高。在此情況下,您可能會想要使用不同的內容來源來編目這兩個網站集合,以使用不同的排程對其進行編目。
完整及累加編目排程
以搜尋服務管理員的身份,可以個別設定對每個內容來源的編目排程。您可以為每個內容來源指定一個時間進行完整編目而另一個時間進行累加編目。
注意
您必須先為特定內容來源執行完整編目,才可執行累加編目。
建議您根據執行搜尋服務的伺服器以及主控編目內容的伺服器之可用性、效能和頻寬考量,規劃編目排程。
規劃編目排程時,請考慮下列最佳作法:
根據類似的可用性及可接受的整體資源使用量,為裝載內容的伺服器分組內容來源中的起始位址。
在主控內容的伺服器為可用且伺服器的資源需求很低時,為每一個內容來源排程累加編目。您也可以新增或編輯一或多個編目程式影響規則,以減少正在編目之伺服器的負載。如需編目程式影響規則的相關資訊,請參閱<管理編目程式影響 (Office SharePoint Server 2007)>。
以交錯方式編目排程,好讓伺服器陣列中的伺服器負載會分散在不同的時間。
唯有出現下一節列出之原因而有需要時,才排程完整編目。建議您執行完整編目的頻率要比累加編目少。
排程必須在規劃完整編目之前立即進行完整編目的管理變更。例如,建議您將編目的建立時間排程在下次完整編目之前,如此一來即不需要再額外進行完整編目。
請依據要執行編目之索引伺服器的容量來排定同時編目。建議您要錯開編目排程,如此索引伺服器才不會同時使用多個內容來源進行編目。索引伺服器的效能和主控內容之伺服器的效能,會決定編目可以重疊的範圍。您可以隨著漸漸熟悉各內容來源的一般編目期間之後,再開發排程編目的策略。建議您記錄在環境中進行編目所需時間的趨勢資料。
執行完整編目的理由
搜尋服務管理員進行完整編目的原因包括:
伺服器陣列中的伺服器上安裝了一或多個 Hotfix 或 Service Pack。如需詳細資訊,請參閱 Hotfix 或 Service Pack 的說明。
SSP 管理員加入了新的 Managed 屬性。
要重新索引 Windows SharePoint Services 3.0 或 Office SharePoint Server 2007 網站上的 ASPX 頁面。
注意
編目程式找不到 Windows SharePoint Services 3.0 或 Office SharePoint Server 2007 網站上之 ASPX 頁面的變更時間。因此刪除個別清單項目時,累加編目不會重新編製檢視或首頁的索引。建議您定期對包含 ASPX 檔案的網站執行完整編目,以確保這些頁面都會重新經過索引。
偵測在上次完整編目檔案共用之後,在檔案共用上進行的安全性變更。
為解決累加編目連續失敗的狀況。在極少數的情況下,若累加編目在任何存放庫層級中連續失敗一百次,索引伺服器會將受影響的內容從索引中移除。
已新增、刪除或修改編目規則。
要修復損毀的索引。
搜尋服務管理員已建立一或多部伺服器名稱對應。
指派給預設內容存取帳戶或編目規則的帳戶已變更。
系統會在下列情況中執行完整編目,即使要求的是累加編目也一樣:
SSP 管理員停止了先前的編目。
從備份還原了內容資料庫。
注意
如果正在執行 Infrastructure Update for Microsoft Office Servers,則可使用 stsadm 命令列工具的還原作業,以變更內容資料庫還原是否會引發完整編目。
伺服器陣列管理員中斷後又重新連接內容資料庫。
未曾完成網站的完整編目。
變更記錄檔不包含正在編目之位址的項目。變更記錄檔中沒有正進行編目之項目的記錄時,無法執行累加編目。
指派給預設內容存取帳戶或編目規則的帳戶已變更。
要修復損毀的索引。
視損毀嚴重性之不同,若在索引中偵測到損毀,系統可能會嘗試執行完整編目。
可以在初始部署之後,根據伺服器陣列中的伺服器及主控內容之伺服器的效能和容量,調整排程。
另請參閱
概念
取得已編目的內容 (Office SharePoint Server 2007)
排程完整編目 (Office SharePoint Server 2007)
排程累加編目 (Office SharePoint Server 2007)