共用方式為


資源集區設計考量

資源集區是管理伺服器和/或閘道伺服器的邏輯群組,可用來將工作分散到自己之間,並從失敗的成員接管工作。 換句話說,它們為工作流程提供高可用性和可擴縮性。 設計管理群組時,必須考慮監視網路裝置、Linux/UNIX 系統,以及為利用資源集區而設計的其他工作負載。

概觀

如果集區中的其中一個成員無法使用,資源集區會提供多個 成員,這些成員是管理伺服器和/或網關伺服器,以接管監視工作流程,以確保監視的持續性。 您可以建立資源集區以提供特定用途。 例如,您可能會在主要數據中心建立管理伺服器的資源集區,以監視網路裝置。

資源集區會套用類似於叢集「多數節點集」的邏輯,其中 (< 節點數目作為集 > 區 /2 的成員) + 1。 至少,集區中必須有三個成員才能維護仲裁,這必須超過集區中仲裁投票成員的 50% 以上,才能維護集區的可用性。 如果您只有兩個集區成員且一個無法使用,則表示已失去仲裁。

針對在 Operations 控制台中建立的每個資源集區,一律會獲得投票權, 即使集區中有偶數成員允許達到仲裁,Operations Manager 資料庫也稱為默認觀察者。 這也適用於當您第一次建立管理群組時預設建立的三個資源集區,本文稍後會討論此群組。 針對使用PowerShell Cmdlet NewSCOM-ResourcePool 建立的所有資源集區,預設會將其設定為停用。 將 Operations Manager 資料庫納入為 默認觀察者 ,只會要求您至少部署兩部管理伺服器,以維持資源集區的高可用性,以減少管理群組的複雜性。

支援資源集區的另一個角色是 觀察者。 這是未參與載入集區工作流程的管理伺服器或閘道伺服器;不過,他們會參與仲裁決策。 這在正常情況下永遠不會使用,因此不應該考慮。

成員資格有兩種類型:

  • 自動
  • 手動

當您建立資源集區時,其成員資格會設定為手動,且無法重新設定為自動。 建立 System Center – Operations Manager 管理群組時,預設會建立三個具有自動成員資格的資源集區。 下表說明這三個資源集區。

資源集區名稱 描述
所有管理伺服器資源集區 執行群組計算、可用性、分散式監視器健全狀況匯總和資料庫清理的工作流程。
通知資源集區 警示訂用帳戶服務工作流程是以此資源集區為目標,以支援警示通知。
AD 指派資源集區 AD 整合工作流程是以此資源集區為目標,可支援自動將代理程式指派給管理伺服器。

由於所有管理伺服器資源集區的成員資格是自動的,因此任何受委託的管理伺服器都會自動成為此資源集區的成員。 在某些架構和設計考慮中,例如納入地理分散應變作業的架構和設計考慮中,可能不需要自動指派給所有管理伺服器資源集區。 在這些情況下,可以將成員資格指派從自動變更為手動。 因此,管理伺服器必須透過手動指派新增至 [所有管理伺服器資源集區]。

注意

所有管理伺服器資源集區的成員資格均為唯讀。 若要將其成員資格從自動變更為手動,請參閱 修改集區成員資格

引進資源集區時,建議所有成員都透過低延遲網路連線(小於 10 毫秒)。 資源集區不應部署在多個數據中心或混合式雲端環境中,例如 azure Microsoft。

資源集區可用性範例

下列範例會根據下列組態來示範資源集區可用性的概念,只使用管理伺服器或僅使用網關伺服器。

單一管理伺服器

  • 默認會啟用默認觀察者,而且不會提供任何權益,因為只有兩個成員且未達到仲裁。
  • 沒有高可用性,因為管理伺服器是單一失敗點。

兩部管理伺服器

  • 默認會啟用默認觀察者
  • 集區有高可用性,因為有三個投票成員 - 兩個管理伺服器和 默認觀察者
  • 如果您停用 默認觀察者,將會失去集區的高可用性。

三部管理伺服器

  • 默認會啟用默認觀察者
  • 集區具有高可用性,因為有四個投票成員 - 三個管理伺服器和 默認觀察者
  • 根據預設,您只能有一部管理伺服器無法維護仲裁。 如果兩部管理伺服器無法使用,則您只有 50% 的投票成員和資源集區無法再運作來管理監視工作負載。
  • 默認 觀察者 不會增加可關閉的管理伺服器數目,因此不會增加集區可用性。
  • 您可以考慮移除 此案例中的默認觀察者

四部管理伺服器

  • 默認會啟用默認觀察者
  • 集區有高可用性,因為有五個投票成員 - 四個管理伺服器和 默認觀察者
  • 根據預設,您只能有兩部管理伺服器無法維護仲裁。 如果三部管理伺服器已關閉,則您只有不到 50% 的投票成員,而資源集區就無法再運作來管理監視工作負載。
  • 此案例中的默認觀察者會提供顯著值,因為它會增加可以關閉的管理伺服器數目。 如果沒有默認觀察者,您只會有四個仲裁成員,這隻允許一個成員無法使用。

五部管理伺服器

  • 默認會啟用默認觀察者
  • 集區具有高可用性,因為有六個投票成員 - 五部管理伺服器和 默認觀察者
  • 根據預設,您只能有兩部管理伺服器無法維護仲裁。 如果三部管理伺服器無法使用,這正好是 50% 的投票成員,而資源集區就無法再運作來管理監視工作負載。
  • 默認 觀察者 不會增加可關閉的管理伺服器數目,因此不會增加集區可用性。
  • 您可以考慮移除 此案例中的默認觀察者

一旦您在資源集區中聯機到三部或多部管理伺服器,其中集區中有奇數的成員,您可以考慮將默認觀察者移除為成員。 如果您觸達五部管理伺服器,作業資料庫可能會經歷大量負載,這可能會產生足夠的延遲,以影響資源集區計算。

使用默認觀察者扮演角色的方式,集區中的每個管理伺服器都會查詢自己的本機 SDK 服務,讓其查詢操作資料庫中的默認觀察者數據表。 如果 SDK 服務或資料庫處於負載之下,您將會遇到不存在的延遲。

單一閘道伺服器

  • 默認會啟用默認觀察者
  • 因為閘道伺服器是單一失敗點,因此沒有高可用性。
  • 因為閘道伺服器沒有本機 SDK 服務,因此無法查詢 Operational 資料庫,所以不應該在這裡使用預設觀察者

兩部閘道伺服器

  • 默認會啟用默認觀察者
  • 沒有高可用性,因為集區只有兩個成員,而 默認觀察者 不是參與者,因為網關伺服器不會直接與 Operational 資料庫通訊。 需要三部閘道伺服器才能維護集區仲裁。

三部閘道伺服器

  • 默認會啟用默認觀察者
  • 集區有高可用性,因為有三個投票成員 - 三個閘道伺服器。
  • 根據預設,您只能有一部網關伺服器無法維護仲裁。 如果兩部閘道伺服器已關閉,這小於 50% 的投票成員,而資源集區就無法再運作來管理監視工作負載。
  • 因為閘道伺服器沒有本機 SDK 服務,因此無法查詢 Operational 資料庫,所以不應該在這裡使用預設觀察者

支援資源集區的監視案例

下列工作流程是由 Operations Manager 中的資源集區所裝載:

  • 管理網路裝置
  • 管理 UNIX/Linux 代理程式
  • 監視 Web 應用程式 URL

注意

Windows 代理程式不會向資源集區報告。

Operations Manager 中的網路監視需要自己的個別專用資源集區。 這是因為網路監視工作流程會在管理伺服器上執行(在 SNMP 模組上),而不是在代理程式上執行。 當您包含網路埠的監視時,這會將大量負載放在管理伺服器上,特別是當您選取裝置上可用的大部分作用中埠時。 因此,為了提升效能,建議您在專用資源集區中使用專用管理伺服器來進行網路監視。 此外,此集區成員的管理伺服器應該從 [所有管理伺服器]、[通知] 和 [AD 指派集區] 中移除。

如果需要啟用高可用性監視和代理程式管理,Operations Manager 中的 Linux/UNIX 監視可以指派給專用資源集區,但並非必要。 Operations Manager 會使用憑證來驗證其管理的計算機存取權。 在部署代理程式時,探索精靈會從代理程式擷取、簽署憑證、將憑證重新部署至代理程式,然後重新啟動代理程式。 若要支援高可用性,資源集區中的每個管理伺服器都必須擁有用來簽署 UNIX 和 Linux 電腦上代理程式部署至代理程式的所有跟證書。 否則,如果管理伺服器變得無法使用,其他管理伺服器將無法信任由失敗的伺服器所簽署的憑證。

下一步

若要瞭解如何建立和管理資源集區,請參閱 如何管理資源集區