Sdílet prostřednictvím


Návrh roztažených clusterů vSAN

V tomto článku se dozvíte, jak navrhnout roztažený cluster vSAN pro privátní cloud Azure VMware Solution.

Pozadí

Globální infrastruktura Azure je rozdělená do oblastí. Každá oblast podporuje služby pro danou zeměpisnou oblast. V rámci každé oblasti Azure sestaví izolované a redundantní ostrovy infrastruktury označované jako zóny dostupnosti (AZ). Az funguje jako hranice pro správu prostředků. Výpočetní prostředky a další prostředky dostupné pro az jsou konečné a můžou být vyčerpány požadavky zákazníků. Skupina AZ je vytvořená tak, aby byla nezávislá na odolnosti, což znamená, že selhání v jedné sadě AZ neovlivňují jiné AZ.

Díky řešení Azure VMware se hostitelé ESXi nasazení v standardním clusteru vSphere tradičně nacházejí v jedné zóně dostupnosti Azure (AZ) a jsou chráněni vysokou dostupností vSphere. Nechrání ale úlohy před selháním azure AZ. Kvůli ochraně před selháním az je možné povolit jeden cluster vSAN, který zahrnuje dvě samostatné zóny dostupnosti, označované jako roztažený cluster vSAN.

Roztažené clustery umožňují konfiguraci domén selhání vSAN mezi dvěma uzly AZ oznámit serveru vCenter, že hostitelé se nacházejí v každé zóně dostupnosti (AZ). Každá doména selhání je pojmenovaná po az, ve které se nachází, aby se zvýšila srozumitelnost. Když roztáhnete cluster vSAN mezi dvěma uzly AZ v rámci oblasti, v případě výpadku az se považuje za událost vSphere HA a virtuální počítač se restartuje v druhé sadě AZ.

Výhody roztaženého clusteru:

  • Zlepšení dostupnosti aplikací
  • Poskytněte možnost nulového cíle bodu obnovení (RPO) pro podnikové aplikace bez nutnosti jejich návrhu nebo nasazení drahých řešení zotavení po havárii.
  • Privátní cloud s roztaženými clustery je navržený tak, aby poskytoval 99,99% dostupnost kvůli odolnosti vůči selháním AZ.
  • Umožňuje zákazníkům soustředit se na základní požadavky a funkce aplikací místo dostupnosti infrastruktury.

Kvůli ochraně před scénářem rozděleného mozku a měření stavu lokality se v třetí sadě AZ vytvoří spravovaná kopie clusteru vSAN. Při kopírování dat v každé az se vSphere HA pokusí zotavit z jakéhokoli selhání pomocí jednoduchého restartování virtuálního počítače.

Následující diagram znázorňuje cluster vSAN roztažený mezi dvěma uzly AZ.

Diagram znázorňuje spravovaný cluster vSAN roztažený ve třetí zóně dostupnosti s daty, která se kopírují do všech tří z nich.

Následující diagram znázorňuje normální tok síťového provozu v clusteru vSAN roztaženého přes dvě AZ.

Diagram znázorňuje toky provozu VMware NSX pro spravovaný roztažený cluster vSAN.

Roztažené clustery zjednodušují požadavky na ochranu tím, že kromě škálování a flexibility infrastruktury Azure poskytují stejné důvěryhodné ovládací prvky a možnosti.

Je důležité si uvědomit, že roztažené privátní cloudy clusteru nabízejí pouze další vrstvu odolnosti a neřeší všechny scénáře selhání. Například roztažené privátní cloudy clusteru:

  • Nechráníte se před selháními na úrovni oblasti v Azure nebo ve scénářích ztráty dat způsobenými problémy s aplikací nebo špatně plánovanými zásadami úložiště.
  • Poskytuje ochranu proti selhání jedné zóny, ale nejsou navrženy tak, aby poskytovaly ochranu proti dvojitým nebo progresivním selháním. Příklad:
    • I přes různé vrstvy redundance integrované do prostředků infrastruktury, pokud selhání mezi az vede k dělení sekundární lokality, zahájí vSphere HA vypnutí virtuálních počítačů úloh v sekundární lokalitě.

      Následující diagram znázorňuje scénář dělení sekundární lokality.

      Diagram znázorňuje vysokou dostupnost vSphere, která vypíná virtuální počítače úloh v sekundární lokalitě.

    • Pokud došlo k selhání dělení sekundární lokality do selhání primární lokality nebo došlo k úplnému dělení, pokusí se vSphere HA restartovat virtuální počítače úloh v sekundární lokalitě. Pokud se služba vSphere HA pokusila restartovat virtuální počítače úloh v sekundární lokalitě, umístila by virtuální počítače úloh do nestálého stavu.

      Následující diagramy znázorňují upřednostňované selhání lokality a kompletní scénáře dělení sítě.

      Diagram znázorňuje vysokou dostupnost vSphere, která se pokouší restartovat virtuální počítače úloh v sekundární lokalitě, když dojde k selhání upřednostňované lokality.

      Diagram znázorňuje vysokou dostupnost vSphere, která se pokouší restartovat virtuální počítače úloh v sekundární lokalitě, když dojde k úplné izolaci sítě.

      Následující diagram znázorňuje tok síťového provozu v clusteru vSAN roztažený během úplného selhání lokality.

      Diagram znázorňuje toky provozu VMware NSX pro spravovaný cluster vSAN roztažený během úplného selhání lokality.

Je třeba poznamenat, že tyto typy selhání, i když vzácné, spadají mimo rozsah ochrany nabízené roztaženým privátním cloudem clusteru. Vzhledem k těmto typům vzácných selhání by se roztažené řešení clusteru mělo považovat za řešení s vysokou dostupností s více AZ, které je závislé na vSphere HA. Je důležité si uvědomit, že roztažené clusterové řešení není určené k nahrazení komplexní strategie zotavení po havárii ve více oblastech, kterou je možné použít k zajištění dostupnosti aplikace. Důvodem je, že řešení zotavení po havárii obvykle obsahuje samostatné roviny správy a řízení v samostatných oblastech Azure. Roztažené clustery Azure VMware Solution mají jednu rovinu správy a řízení roztaženou mezi dvěma zónami dostupnosti ve stejné oblasti Azure. Například jeden vCenter Server, jeden cluster NSX Manager, jeden pár virtuálních počítačů NSX Edge.

Dostupnost roztaženého clusteru

Roztažené clustery Azure VMware Solution jsou k dispozici v následujících oblastech:

  • Velká Británie – jih (na AV36 a AV36P)
  • Západní Evropa (na AV36 a AV36P)
  • Německo – středozápad (v AV36 a AV36P)
  • Austrálie – východ (v AV36P)
  • USA – východ (v AV36P)

Podporované zásady úložiště

Následující zásady SPBM jsou podporovány s PFTT duální zrcadlení lokality a SFTT raid 1 (zrcadlení) povolené jako výchozí zásady pro cluster:

  • Nastavení odolnosti proti havárii webu (PFTT):
    • Zrcadlení duálního webu
    • Žádné – zachování upřednostňovaných dat
    • Žádné – zachování dat v nepřeferných datech
  • Místní selhání tolerovat (SFTT):
    • 1 selhání – RAID 1 (zrcadlení)
    • 1 selhání – RAID 5 (kódování mazání) vyžaduje v každém AZ minimálně čtyři hostitele.
    • 2 selhání – RAID 1 (zrcadlení)
    • 2 selhání – RAID 6 (kódování mazání) vyžaduje v každém AZ minimálně šest hostitelů.
    • 3 selhání – RAID 1 (zrcadlení)

Často kladené dotazy

Plánujete nějaké další oblasti?

V současné době se pro roztažené clustery podporuje pět oblastí.

Jaký druh smlouvy SLA poskytuje řešení Azure VMware s roztaženými clustery?

Privátní cloud vytvořený s roztaženým clusterem vSAN je navržený tak, aby nabízel 99,99% závazek dostupnosti infrastruktury, pokud existují následující podmínky:

  • V clusteru se nasadí minimálně šest uzlů (3 v každé zóně dostupnosti).
  • Když virtuální počítače používají zásady úložiště virtuálních počítačů PFTT zrcadlení se dvěma lokalitami a SFTT 1 virtuálních počítačů úloh.
  • K dosažení cílů dostupnosti se vyžaduje dodržování dalších požadavků zachycených v podrobnostech smlouvy SLA o řešení Azure VMware Solution.

Můžu zvolit zónu dostupnosti, ve které je privátní cloud nasazený?

Ne. Roztažený cluster se vytvoří mezi dvěma zónami dostupnosti, zatímco třetí zóna se používá k nasazení uzlu s kopií clusteru. Vzhledem k tomu, že se všechny zóny efektivně používají k nasazení roztaženého clusterového prostředí, není zákazníkovi k dispozici volba. Místo toho se zákazník rozhodne nasadit hostitele v několika zónách AZ při vytváření privátního cloudu.

Jaká jsou omezení, o které mám vědět?

  • Jakmile se privátní cloud vytvoří s roztaženým clusterem, nedá se změnit na standardní privátní cloud clusteru. Podobně se po vytvoření nedá privátní cloud standardního clusteru změnit na roztažený privátní cloud clusteru.
  • Horizontální navýšení kapacity a horizontální navýšení kapacity roztaženého clusteru může probíhat pouze ve dvojicích. V roztaženém clusterovém prostředí se podporuje minimálně šest uzlů a maximálně 16 uzlů. Další informace najdete v tématu Limity, kvóty a omezení předplatného a služeb Azure.
  • Virtuální počítače úloh zákazníků se restartují se střední prioritou vysoké dostupnosti vSphere. Virtuální počítače pro správu mají nejvyšší prioritu restartování.
  • Řešení spoléhá na vSphere HA a vSAN pro restartování a replikaci. Cíl doby obnovení (RTO) je určen dobou, po kterou trvá restartování virtuálního počítače vSphere HA v az po selhání jednoho az.
  • V prostředí roztaženého clusteru se v současné době nepodporuje:
    • Nedávno vydané funkce, jako je veřejná IP adresa mimo provoz na NSX Edge a externí úložiště, jako jsou úložiště dat ANF.
    • Doplňky pro zotavení po havárii, jako jsou VMware SRM, Zerto a JetStream.
  • Otevřete lístek podpory na webu Azure Portal pro následující scénáře (nezapomeňte jako typ problému vybrat roztažené clustery):
    • Připojte privátní cloud k roztaženému privátnímu cloudu clusteru.
    • Propojte dva roztažené privátní cloudy clusteru v jedné oblasti.

Jaký druh latencí mám mezi zónami dostupnosti (AZ) očekávat?

Roztažené clustery vSAN fungují v rámci 5 milisekund doby odezvy (RTT) a 10 Gb/s nebo větší šířky pásma mezi AZ, které hostují virtuální počítače úloh. Nasazení roztaženého clusteru Azure VMware Solution se řídí tímto principem. Vezměte v úvahu informace při nasazování aplikací (s SFTT zrcadlení duální lokality, která používá synchronní zápisy), které mají přísné požadavky na latenci.

Můžu v privátním cloudu kombinovat roztažené a standardní clustery?

Ne. Kombinace roztažených a standardních clusterů se nepodporuje ve stejném privátním cloudu. Při vytváření privátního cloudu se vybere roztažené nebo standardní prostředí clusteru. Jakmile se privátní cloud vytvoří s roztaženým clusterem, předpokládá se, že se všechny clustery vytvořené v rámci privátního cloudu rozprostírají v přírodě.

Kolik stojí řešení?

Zákazníci se účtují na základě počtu uzlů nasazených v rámci privátního cloudu.

Účtují se mi poplatky za uzel s kopií clusteru a provoz mezi az?

Ne. Zákazníci nevidí poplatky za uzel s kopií clusteru a provoz mezi az. Uzel s kopií clusteru je plně spravovaný a Azure VMware Solution poskytuje požadovanou správu životního cyklu uzlu s kopií clusteru. Vzhledem k tomu, že celé řešení je spravované službou, zákazník potřebuje pouze identifikovat příslušné zásady SPBM nastavené pro virtuální počítače úloh. Zbytek se spravuje prostřednictvím Microsoftu.