在 SharePoint Server 中規劃編目及同盟
適用於:2013 Subscription Edition SharePoint in Microsoft 365
您必須先編目要讓使用者搜尋的內容或將其結為同盟,使用者才能在 SharePoint Server 中執行搜尋。 當您編目內容時,搜尋服務會建置可供使用者執行查詢 (搜尋要求) 的搜尋索引。 您也可以設定搜尋系統,使其同時顯示來自於外部提供者 (例如 Bing) 的搜尋結果和來自於本機搜尋索引的結果。 從外部提供者取得搜尋結果並將其顯示於本機的程序,稱為同盟。
規劃內容來源
內容來源是指編目設定群組的定義,這些設定包括所要編目的主機、所將編目的內容類型 (例如 SharePoint 內容或檔案共用)、編目排程與編目的深度等。
當您建立 Search Service 應用程式時,此服務應用程式會自動提供預先設定的內容來源本機 SharePoint 網站。 您可以使用此內容來源,指定如何編目與 Search Service 應用程式相關聯之 Web 應用程式中的 SharePoint 內容。
若您只有一種類型的內容 (例如,所有內容都屬於「SharePoint 網站」類型或「檔案共用」類型),您可能只需要一個內容來源。 但若您有不同類型的內容,或每部主機各有不同的需求,則您可以定義多個內容來源。 若您需要執行下列作業,請規劃建立更多內容來源:
編目不同類型的內容,例如企業營運系統應用程式中的檔案共用與資料
在不同的排程上編目某些內容
限制或增加要編目的內容量
為不同網站的編目設定不同的屬性
只更新某些類型的內容
您可以在每個 Search Service 應用程式中建立大量的內容來源,但是每個內容來源有相關的額外負荷。 因此,建議您建立可滿足其他操作需求 (例如編目優先順序和編目排程中的差異) 的最少內容來源數目。 各內容來源可以包含最多 100 個起始位址。
規劃如何編目不同種類的內容
每個內容來源只可編目一種內容。 例如,您可以建立包含 SharePoint 網站之起始位址的內容來源,也可建立包含檔案共用之起始位址的內容來源,但無法建立一個內容來源而同時包含 SharePoint 網站與檔案共用的起始位址。 下表列出您可以設定的內容來源種類。
**使用這種內容來源 | 若為此內容 |
---|---|
SharePoint 網站 | 同一個伺服器陣列或不同 SharePoint Server 伺服器陣列中的 SharePoint 網站。 來自相同伺服器陣列或不同SharePoint Server 2019、SharePoint Server 2016、SharePoint Server 2013、SharePoint Server 2010、SharePoint Foundation 2010 或 Microsoft Search Server 2010 伺服器數組的 SharePoint 網站。 同一個伺服器陣列或不同 Office SharePoint Server 2007、Windows SharePoint Services 3.0 或 Search Server 2008 伺服器陣列中的 SharePoint 網站。 |
網站 | 組織中其他位於 SharePoint 網站上的 Web 內容。 網際網路上的網站內容。 |
檔案共用 | 組織中檔案共用上的內容。 安全性提示: 當搜尋服務編目檔案共用時,若對共用檔案的權限與對包含該檔案之資料夾的權限不相同,對檔案的權限將具有優先權,而會用於搜尋結果的安全性修剪。 因此,為確保只有適當的項目會出現在搜尋結果中,請確定檔案共用上的檔案權限是適當的。 若檔案權限不適當,您可以從搜尋索引或搜尋結果中刪除特定項目。 如需詳細資訊,請參閱 Delete items from the search index or from search results in SharePoint Server。 |
Exchange 公用資料夾 | Exchange 2007 與 Exchange Server 2010 公用資料夾。 |
Lotus Notes | Lotus Notes 資料庫中所儲存的電子郵件訊息。 附註: 不同於其他種類的內容來源,除非您先安裝及設定適當的先決條件軟體,否則使用者介面中將不會出現 Lotus Notes 內容來源選項。 如需詳細資訊,請參閱< Configure and use the Lotus Notes connector for SharePoint Server> (也適用於 SharePoint Server)。 |
Documentum | EMC Documentum 系統中的內容。 注意: 在安裝並設定適當的必要條件軟體和適用於 Documentum 的 Microsoft sharePoint 索引連接器之前,您無法編目 EMC Documentum 內容。 如需詳細資訊,請參閱< Configure and use the Documentum connector in SharePoint Server> (也適用於 SharePoint Server)。 |
企業營運資料 | 儲存在企業營運系統應用程式中的商務資料。 |
自訂存放庫 | 必須先安裝及登錄自訂連接器後才能編目的內容來源。 |
企業營運資料的內容來源
商務資料內容來源需要在 Business Data Connectivity 服務應用程式的應用程式模型中指定裝載資料的應用程式。 您可以建立一個內容來源以編目在 Business Data Connectivity 服務中登錄的所有應用程式,或建立個別的內容來源以編目各個應用程式。 如需詳細資訊,請參閱 SharePoint 2013 的搜尋連接器架構 (此 MSDN 文章也適用於 SharePoint Server)。
通常,規劃將商務資料整合到網站集合的人員不會是整體內容規劃程序中的同一組人員。 因此,請納入內容規劃小組的商務應用程式管理員,這樣管理員才能建議您如何將商務應用程式資料整合到內容,並有效地呈現在網站集合中。
編目不同排程的內容
基於下列理由,請考慮以不同的排程定義內容來源:
配合停機時間與尖峰用量時段。
更常編目經常更新的內容。
分開編目速度較慢之伺服器上的內容,以及速度較快之伺服器上的內容。
因有對高新鮮度內容的需要而必須持續編目 SharePoint 內容來源。 如需詳細資訊,請參閱<管理 SharePoint Server 中的連續編目>。
執行完整編目的原因
搜尋服務應用程式管理員對一或多個內容來源進行完整編目的原因如下:
Search Service 應用程式才剛建立,而尚未編目預先設定的內容來源 [本機 SharePoint 網站]。
有其他內容來源是新的,且尚未編目。
Search Service 應用程式管理員已變更內容來源。
已在伺服器陣列的伺服器上安裝軟體更新或 Service Pack。 如需詳細資訊,請參閱軟體更新或 Service Pack 的說明。
Search Service 應用程式管理員或網站集合管理員已新增或變更受管理屬性。 必須執行所有受影響內容來源的完整編目,新的或已變更的受管理屬性才會生效。
您想要偵測安全性變更 (在上次檔案共用的完整編目後,檔案共用的本機群組所做的變更)。
您想要解決連續的累加編目失敗。 如果任何特定內容的累加編目連續出現多次失敗,系統會從搜尋索引移除受影響的內容。
已新增、刪除或修改編目規則。
您想要取代毀損的搜尋索引。
指派給預設內容存取帳戶的使用者帳戶權限已變更。
,即使累加編目或連續編目已在下列情況下排程,系統仍會執行完整編目:
搜尋管理員已停止先前的編目。
內容資料庫已還原,或伺服器陣列管理員已中斷內容資料庫連線再重新附加。
此 Search Service 應用程式中的內容來源完整編目從未完成。
編目資料庫未包含正在編目之位址的項目。 若正在編目項目的編目資料庫中沒有項目,就不會執行累加編目。
限制或增加要編目的內容量
每項內容來源的屬性中所能使用的選項不一,取決於所選的內容來源類型。 您可以使用編目設定選項,限制或增加要編目的內容量。 對於每項內容來源,您可以指定從起始位址開始編目的範圍。 大部分內容來源類型都可讓您指定您要編目的階層深度 (從每一個起始位址起算)。 此行為會套用到特定內容來源中的所有起始位址。 如需要編目到一些更深階層的網站,可以另建包含這些網站的內容來源。 下表是設定編目選項時的最佳作法。
請使用此內容來源種類 | 若情況是... | 使用這個編目設定選項 |
---|---|---|
SharePoint 網站 | 您只要加入網站本身的內容,而不要加入其子網站的內容;或是您要編目子網站上不同排程的內容。 | 只要編目每個起始位址的 SharePoint 網站。 |
SharePoint 網站 | 您要加入網站本身的內容。 -或- 您要編目起始位址下所有排程相同的內容。 |
編目每個起始位址之主機名稱下的所有內容。 |
網站 | 所連結之網站上的內容可能毫不相關。 | 只編目每個起始位址之伺服器上的內容。 |
網站 | 相關的內容只位於第一頁。 | 只編目每個起始位址的第一頁。 |
網站 | 您要限制編目起始位址上之連結的深度。 | 自訂 指定要編目的頁數深度及伺服器躍點數。 附註: 對於連線頻繁的網站,建議您先從小量著手,因為指定超過三頁的深度或超過三個伺服器躍點,可能會編目整個網際網路。 |
檔案共用 Exchange 公用資料夾 |
子資料夾中的內容可能毫不相關。 | 只編目每個起始位址的資料夾。 |
檔案共用 Exchange 公用資料夾 |
子資料夾中的內容可能互有相關。 | 編目每個起始位址的資料夾與子資料夾。 |
商務資料 | 商務資料目錄中繼資料存放區中所登錄的所有應用程式皆包含相關的內容。 | 編目整個商務資料目錄中繼資料存放區。 |
商務資料 | 商務資料目錄中繼資料存放區中所登錄的應用程式並非全都包含相關的內容。 -或- 您要編目某些不同排程的應用程式。 |
編目選取的應用程式。 |
規劃連接器
編目程式會使用連接器 (在舊版 SharePoint Server 中稱為「通訊協定處理常式」) 來取得及索引內容。 對於最常用的通訊協定,SharePoint Server 會提供並自動使用適當的連接器。 若要編目的內容需要預設連接器以外的連接器,必須先安裝第三方的連接器或建立自訂的連接器。 如需預設會安裝之連接器的清單,請參閱Default connectors in SharePoint Server (也適用於 SharePoint Server)。
規劃內容來源時的其他注意事項
針對相同類型的內容存放庫 (例如 SharePoint 網站) 來決定是否要使用一或多個內容來源時,有很大部分取決於管理方面的考量。 為讓管理工作更簡單,建議在組織內容來源時,能夠採用管理員易於更新內容來源、編目規則及編目排程的方式。
您無法使用同一個 Search Service 應用程式中的多項內容來源來編目相同的起始位址。 例如,當您使用特定內容來源編目網站集合及其所有子網站之後,即無法再於不同的時間使用其他內容來源個別編目其中的子網站。
管理員經常更新內容來源。 變更內容來源需要對該內容來源進行完整編目。 因此請考慮建立個別的內容來源,以便在必要時同時執行多個完整編目,並且縮短任何特定內容來源的完整編目時間。
規劃編目規則以達最佳編目效果
編目規則會套用到 Search Service 應用程式中的所有內容來源。 您可以只將編目規則套用到某個或某些 URL,以達成下列目的:
藉由排除一或多個 URL 避免編目不相關的內容。 這同時也可減少使用伺服器資源與網路流量。
只編目 URL 的連結,而不編目 URL 本身。 當網站包含相關內容的連結,而頁面中所含的連結卻包含不相關的資訊時,即可使用此選項。
編目複雜的 URL。 此選項會指示系統編目含有問號來指定查詢參數的 URL。 這些 URL 可能不含相關的內容,視網站而定。 由於複雜的 URL 常會重新導向到不相關的網站,因此建議只有在確定複雜 URL 所連到的內容確實相關時,才在網站上啟用此選項。
讓 SharePoint 網站上的內容編目為 HTTP 頁面。 此選項可讓搜尋系統編目位於防火牆後方的 SharePoint 網站,或是在所處環境中,所編目的網站對編目程式 (搜尋拓撲中的編目元件) 使用之 Web 服務的存取有所限制的 SharePoint 網站。
指定要使用預設的內容存取帳戶、其他內容存取帳戶或用戶端憑證來編目指定的 URL 。
由於編目內容會耗費資源與頻寬,因此只加入少量您確認相關的內容,會比加入大量毫不相關的內容來得好。 完成初始部署之後,您可以查閱查詢與編目記錄檔,調整內容來源與編目規則的相關程度,然後加入更多的內容。
規劃編目程式驗證
當編目程式存取內容來源中所列的起始位址時,必須通過內容代管伺服器的驗證及授權。 系統預設會使用預設的內容存取帳戶。 您也可使用編目規則指定在編目特定內容時使用其他內容存取帳戶。 當您使用預設的內容存取帳戶或編目規則所指定的其他內容存取帳戶時,所使用的內容存取帳戶至少須具備所有編目內容的讀取權限。 否則不只不會編目內容,還不會為內容編製索引,致使查詢也無從使用。
建議讓指定的預設內容存取帳戶具備大部分編目內容的存取權。 僅當有安全性考量而必須區分內容存取帳戶時,才使用其他內容存取帳戶。
您必須為您所規劃的每一項內容來源指定內容存取帳戶預設無法存取的起始位址,然後再規劃如何加入這些起始位址的編目規則。
重要事項
[!重要事項] 請確認預設內容存取帳戶或其他內容存取帳戶所使用的網域帳戶,不是所編目之 Web 應用程式關聯的應用程式集區所使用的網域帳戶。 這可讓 SharePoint 網站上尚未發佈的內容與檔案次要版本 (即歷程記錄) 加入編目與索引編製。
另一項重要注意事項是編目程式所使用的驗證通訊協定,必須與主機伺服器相同。 編目程序預設會使用 NTLM 進行驗證。 如有必要,可以設定編目程式使用其他驗證通訊協定。
若要使用宣告式驗證,必須啟用所要編目之 Web 應用程式的 Windows 驗證。
規劃內容處理
編目程式會編目內容來源指定的內容存放庫,然後將已編目之項目的內容與中繼資料饋送到內容處理元件。 內容處理元件會讀取並剖析編目屬性,然後將這些屬性報告至搜尋管理資料庫。
您可以將編目屬性對應至 Managed 屬性,然後編輯搜尋結構描述以設定屬性設定。 內容處理元件會讀取搜尋結構描述,並使用此結構描述進行對應。 只有 Managed 屬性會納入搜尋索引中。 Managed 屬性可用來建立精簡器或執行其他作業。 如需詳細資訊,請參閱SharePoint Server 的搜尋結構描述概觀。
加入或排除檔案類型
您可以在搜尋索引中納入任何檔案類型的內容。 若要編製內容的索引,必須先由編目元件加以編目,然後由內容處理元件加以剖析。 檔案的副檔名必須包含在 [管理檔案類型] 頁面上的副檔名清單中,編目元件才能編目該檔案。 只有在下列情況下,內容處理元件才能剖析已編目的檔案內容:
內容處理元件具有可剖析檔案格式的格式處理常式。
內容處理元件能夠剖析具有檔案格式及副檔名的檔案。
如果內容處理元件無法剖析檔案,搜尋索引只會包含檔案內容,例如檔案名稱。
根據預設,SharePoint Server 會滿足眾多檔案類型的上述需求,且可以編目及剖析這些檔案類型,不需要您安裝額外的格式處理常式。 如需檔案類型的概觀,請參閱<Default crawled file name extensions and parsed file types in SharePoint Server>。
注意事項
[!附註] 您可以延伸檔案格式的初始集合,SharePoint Server 可新增第三方篩選器型格式處理常式 (亦稱為 iFilter) 來加以剖析。 第三方 iFilter 可以覆寫內建的格式處理常式。
若內容存放庫的檔案類型「不」在 [管理檔案類型] 頁面中,而您打算將內容包含在該來源的搜尋索引中,請檢閱下列事項:
若要編目檔案類型,請將該檔案類型新增到 [管理檔案類型] 頁面中。
剖析檔案類型:
如果 SharePoint Server 沒有該格式的格式處理常式,請在每部伺服器 (裝載 Search Service 應用程式內容處理元件) 上,為該檔案格式安裝第三方篩選器型格式處理常式。
在每部伺服器 (裝載 Search Service 應用程式內容處理元件) 上啟用檔案格式剖析及副檔名
如需詳細資訊,請參閱<Add or remove a file type from the search index in SharePoint Server>。
規劃如何使用 (自訂) 實體擷取器
您可以設定搜尋系統搜尋非結構化內容中的「實體」,例如在文件的本文或標題中。 這些實體可能是文字或片語,例如產品名稱。 若要指定所要搜尋的實體,可以建立及部署自己的字典。
所擷取的實體會各以不同的 Managed 屬性儲存在搜尋索引中;而這些 Managed 屬性會自動設定為可搜尋、可查詢、可擷取、可排序及可精簡。 例如,您可以在搜尋精簡器中使用這些屬性,協助使用者篩選其搜尋結果。
若為公司,您可使用 SharePoint Server 提供之預先填入的公司擷取字典。
除此之外,您還可以利用自訂實體擷取字典的形式,部署數種自訂實體擷取器。 您可以使用 Microsoft PowerShell 部署這些字典。 字典中的實體 (一或多個單字) 可以區分大小寫或不分大小寫的方式,與內容中的字詞或局部字詞進行比對。 如需詳細資訊,請參閱<在 SharePoint Server 中建立及部署自訂實體擷取器>。
自訂實體擷取器/字典 | 描述 |
---|---|
全字相符 | 不分大小寫,最多 5 個字典。 例如 "anchor" 項目會視為與 "anchor" 及 "Anchor" 相符,而不會視為與 "anchorage" 相符。 |
全字部分相符 | 不分大小寫,最多 5 個字典。 例如 "anchor" 項目會視為與 "anchor"、"Anchor" 及部分 "anchorage" 相符。 |
全字相符擷取 | 區分大小寫,最多 1 個字典。 例如 "anchor" 項目會視為與 "anchor" 相符,而不會視為與 "Anchor" 或 "anchorage" 相符。 |
全字部分相符擷取 | 區分大小寫,最多 1 個字典。 例如 "anchor" 項目會視為與 "anchor" 及部分 "anchorage" 相符,而不會視為與 "Anchor" 相符。 |
關於結果來源與同盟
In SharePoint Server, you use a result source to specify the URL of a provider to get search results from, a protocol to use to get those results, and other related settings. For example, the preconfigured default result source is Local SharePoint Results.
您可以新增結果來源,以指定您要從中取得搜尋結果的外部搜尋提供者 (例如遠端搜尋引擎或饋送)。 此動作稱為「同盟」。
關於同盟
使用同盟時,使用者可以搜尋和擷取本機伺服器陣列中伺服器尚未編目的內容。 例如,同盟所提供的搜尋結果可能來自 Web 搜尋提供者 (如 Bing) 或您沒有存取權可編目的私人資料集。
如果組織分散在不同地理區,而且想要在每個位置都有其專屬搜尋索引時提供其各種位置之內容的搜尋存取權,則同盟也可以是不錯的方案。 因為每個位置都提供來自其專屬索引的搜尋結果,所以不需要部署可建立和存取單一統一索引的集中式搜尋服務。 在此內容中,同盟所提供的優點如下:
低頻寬需求 - 地理位置分散的組織可能沒有編目和編製大量遠端內容索引所需的高網路頻寬。 組織使用同盟時,跨廣域網路針對搜尋所傳輸的主要資料只是一組來自每個同盟內容存放庫的搜尋結果。
搜尋結果的完整性 - 組織內的每個部門可以比集中式搜尋部署能夠搜耙整個組織中的所有內容更快地編目本機內容。
部門搜尋變化 - 當組織使用同盟時,組織內的每個部門都可以提供並控制自己的搜尋環境。 舉例來說,每個部門都可以將搜尋調整成其專屬需求和喜好設定、具有其專屬使用者體驗和其專屬搜尋連接器。 集中式搜尋入口網站不允許這類差異。
有限的搜尋索引大小 - 地理位置分散的大型組織可能會有數百萬份檔。 因為需要有支援這類大型索引的基礎架構,所以讓組織具有單一的統一搜尋索引並不實際。 同盟可讓每個部門中的使用者執行單一搜尋,以找出組織中分散在多個較小型搜尋索引的相關內容。
使用結果來源進行同盟
若要在 SharePoint Server 中使用同盟,請在 [新增/編輯結果來源] 頁面的 [通訊協定] 區段中選取下列其中一種通訊協定:
您選取此通訊協定 | 透過這種提供者取得同盟搜尋結果 |
---|---|
遠端 SharePoint | 另一個 SharePoint Server 伺服器陣列中搜尋服務的索引 |
OpenSearch 1.0/1.1 | 使用 OpenSearch 通訊協定的外部搜尋引擎或摘要 (如 Bing) |
Exchange | Exchange Server 2013 |
注意事項
在 [新增/編輯結果來源] 頁面上,當您選取上表中顯示的其中一種通訊協定時,也必須填寫頁面上的其他相關欄位,以完整指定結果來源。
另請參閱
在 SharePoint Server 中設定搜尋的結果來源
Manage crawling in SharePoint Server
Default connectors in SharePoint Server