Principy kvora clusteru a fondu
Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server
Důležité
Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.
Clustering s podporou převzetí služeb při selhání Windows Serveru poskytuje vysokou dostupnost pro úlohy spuštěné v clusterech Azure Stack HCI a Windows Server. Tyto prostředky jsou považovány za vysoce dostupné, pokud jsou uzly, které hostují prostředky; Cluster ale obecně vyžaduje, aby běžel více než polovina uzlů, což se označuje jako kvorum.
Kvorum je navržené tak, aby zabránilo scénářům rozděleného mozku , ke kterým může dojít, když je v síti oddíl a podmnožina uzlů mezi sebou nemůžou komunikovat. To může způsobit, že se obě podmnožina uzlů pokusí vlastnit úlohu a zapisovat na stejný disk, což může vést k mnoha problémům. Tomu ale brání koncept kvora clusteringu s podporou převzetí služeb při selhání, který vynutí, aby pokračovala v provozu pouze jedna z těchto skupin uzlů, takže pouze jedna z těchto skupin zůstane online.
Kvorum určuje počet selhání, které může cluster zachovat, i když zůstane online. Kvorum je navržené tak, aby zpracovával scénář, kdy došlo k problému s komunikací mezi podmnožinami uzlů clusteru, aby se více serverů nepokoušal současně hostovat skupinu prostředků a zapisovat na stejný disk současně. Díky tomuto konceptu kvora cluster vynutí, aby se služba clusteru zastavila v jedné z podmnožina uzlů, aby se zajistilo, že existuje pouze jeden skutečný vlastník konkrétní skupiny prostředků. Uzly, které byly zastaveny, můžou znovu komunikovat s hlavní skupinou uzlů a automaticky se znovu připojí ke clusteru a spustí jejich službu clusteru.
V Azure Stack HCI a Windows Serveru 2019 existují dvě komponenty systému, které mají vlastní mechanismy kvora:
- Kvorum clusteru: Funguje to na úrovni clusteru (tj. můžete ztratit uzly a nechat cluster zůstat vzhůru).
- Kvorum fondu: Funguje na úrovni fondu (tj. můžete ztratit uzly a jednotky a zůstat ve fondu vzhůru). Fondy úložiště byly navrženy tak, aby se používaly v clusterovaných i ne clusterových scénářích, což je důvod, proč mají jiný mechanismus kvora.
Přehled kvora clusteru
Následující tabulka poskytuje přehled výsledků kvora clusteru pro jednotlivé scénáře:
Uzly serveru | Může přežít selhání jednoho uzlu serveru | Může přežít selhání jednoho uzlu serveru a pak druhý | Dokáže přežít dvě selhání souběžných uzlů serveru. |
---|---|---|---|
2 | 50/50 | No | Ne |
2 + svědek | Yes | No | Ne |
3 | Ano | 50/50 | No |
3 + svědek | Ano | Ano | No |
4 | Ano | Yes | 50/50 |
4 + svědek | Ano | Ano | Yes |
5 a vyšší | Ano | Ano | Yes |
Doporučení kvora clusteru
- Pokud máte dva uzly, vyžaduje se určující složka.
- Pokud máte tři nebo čtyři uzly, důrazně se doporučuje určující kopie clusteru.
- Pokud máte pět uzlů nebo víc, není potřeba určující kopii clusteru a neposkytuje další odolnost.
- Pokud máte přístup k internetu, použijte určující cloud.
- Pokud jste v IT prostředí s jinými počítači a sdílenými složkami, použijte určující sdílenou složku.
Jak funguje kvorum clusteru
Pokud uzly selžou nebo když některé podmnožina uzlů ztratí kontakt s jinou podmnožinou, musí přeživší uzly ověřit, že tvoří většinu clusteru, aby zůstaly online. Pokud to nemůžou ověřit, přejdou do režimu offline.
Koncept většiny ale funguje čistě pouze v případě, že je celkový počet uzlů v clusteru lichý (například tři uzly v clusteru s pěti uzly). Co tedy clustery s sudým počtem uzlů (například cluster se čtyřmi uzly)?
Cluster může vytvořit celkový počet hlasů lichý dvěma způsoby:
- Za prvé, to může jít nahoru tím, že přidá svědka s dodatečným hlasem. To vyžaduje nastavení uživatele.
- Nebo se může snížit o jeden tím, že vynuluje jeden nechutný hlas uzlu (stane se automaticky podle potřeby).
Pokaždé, když přeživší uzly úspěšně ověří, že jsou většinou, definice většiny se aktualizuje tak, aby byla mezi pouze přeživšími. To umožňuje clusteru ztratit jeden uzel, pak druhý, pak jiný atd. Tento koncept celkového počtu hlasů , které se adaptují po následných selháních, se označuje jako dynamické kvorum.
Dynamický s kopií clusteru
Dynamický svědek přepíná hlas určujícího, aby se zajistilo, že celkový počet hlasů je lichý. Pokud existuje lichý počet hlasů, svědek nemá hlas. Pokud existuje sudý počet hlasů, má svědek hlas. Dynamická určující složka výrazně snižuje riziko, že cluster kvůli selhání s kopií clusteru nefunguje. Cluster se rozhodne, jestli se má hlas určující kopie použít na základě počtu hlasovacích uzlů, které jsou v clusteru dostupné.
Dynamické kvorum funguje s dynamickým kopií clusteru způsobem popsaným níže.
Dynamické chování kvora
- Pokud máte sudý početuzlůchch Hlasy mají například jenom tři ze čtyř uzlů, takže celkový počet hlasů je tři a dva přeživší s hlasy se považují za většinu.
- Pokud máte lichý počet uzlů a žádný určující, všichni dostanou hlasy.
- Pokud máte sudý početuzlůch
- Pokud máte lichý početuzlůch
Dynamické kvorum umožňuje dynamicky přiřadit hlas uzlu, aby se zabránilo ztrátě většiny hlasů a aby cluster mohl běžet s jedním uzlem (označovaným jako posledního člověka). Jako příklad si vezmeme cluster se čtyřmi uzly. Předpokládejme, že kvorum vyžaduje 3 hlasy.
V takovém případě by se cluster po ztrátě dvou uzlů odešel.
Dynamické kvorum ale brání tomu, aby k tomuto problému došlo. Celkový počet hlasů požadovaných pro kvorum se teď určuje na základě počtu dostupných uzlů. S dynamickým kvorem tedy cluster zůstane vzhůru, i když ztratíte tři uzly.
Výše uvedený scénář platí pro obecný cluster, který nemá povolené Prostory úložiště s přímým přístupem. Pokud je ale Prostory úložiště s přímým přístupem povolená, cluster může podporovat pouze dvě selhání uzlů. To je vysvětleno více v části kvora fondu.
Příklady
Dva uzly bez určující kopie
Hlas jednoho uzlu je nulový, takže většina hlasů je určena z celkového počtu 1 hlasů. Pokud neočekávaně dojde k výpadku neočekávaně, přeživší má 1/1 a cluster přežije. Pokud dojde k neočekávanému výpadku hlasovacího uzlu, přeživší má 0/1 a cluster se vypne. Pokud je hlasovací uzel řádně vypnutý, hlas se přenese do druhého uzlu a cluster přežije. Proto je důležité nakonfigurovat určující kopii clusteru.
- Dokáže přežít jedno selhání serveru: padesát procent pravděpodobnosti.
- Může přežít selhání jednoho serveru a pak druhý: Ne.
- Může přežít dvě selhání serveru najednou: Ne.
Dva uzly s kopií clusteru
Oba uzly hlasují, plus hlasy svědků, takže většina je určena z celkového počtu 3 hlasů. Pokud některý z uzlů přestane fungovat, přeživší má 2/3 a cluster přežije.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ne.
- Může přežít dvě selhání serveru najednou: Ne.
Tři uzly bez určující kopie
Všechny uzly hlasují, takže většina je určena z celkového počtu 3 hlasů. Pokud některý uzel přestane fungovat, přeživší jsou 2/3 a cluster přežije. Cluster se stane dvěma uzly bez určující kopie clusteru – v tomto okamžiku jste ve scénáři 1.
- Může přežít jedno selhání serveru: Ano.
- Dokáže přežít selhání jednoho serveru a pak druhý: padesát procent pravděpodobnosti.
- Může přežít dvě selhání serveru najednou: Ne.
Tři uzly s kopií clusteru
Všechny uzly hlasují, takže určující složka na začátku hlasuje. Většina je určena z celkového počtu 3 hlasů. Po jedné chybě má cluster dva uzly s kopií clusteru , což je zpět ke scénáři 2. Takže teď dva uzly a hlas určující určující.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ano.
- Může přežít dvě selhání serveru najednou: Ne.
Čtyři uzly bez určující kopie
Hlas jednoho uzlu je nulový, takže většina je určena z celkového počtu 3 hlasů. Po jednom selhání se cluster stane třemi uzly a vy jste ve scénáři 3.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ano.
- Dokáže přežít dvě selhání serveru najednou: padesát procent pravděpodobnosti.
Čtyři uzly s kopií clusteru
Všechny uzly hlasují a hlasy svědků, takže většina je určena z celkového počtu 5 hlasů. Po jednom selhání jste ve scénáři 4. Po dvou souběžných selháních přejdete na scénář 2.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ano.
- Může přežít dvě selhání serveru najednou: Ano.
Pět uzlů a mimo ni
Všechny uzly hlasují, nebo jen jeden hlas, a to vše, co činí celkový lichý. Prostory úložiště s přímým přístupem stejně nemůže zpracovat více než dva uzly, takže v tuto chvíli není potřeba ani užitečný žádný určující disk.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ano.
- Může přežít dvě selhání serveru najednou: Ano.
Teď, když rozumíme tomu, jak kvorum funguje, se podíváme na typy svědků kvora.
Typy určujících kopií kvora
Clustering s podporou převzetí služeb při selhání podporuje tři typy svědků kvora:
- Kopie clusteru cloudu – Úložiště objektů blob v Azure přístupné pro všechny uzly clusteru Uchovává informace o clusteringu v souboru witness.log, ale neukládá kopii databáze clusteru.
- Sdílená složka s kopií clusteru – sdílená složka SMB nakonfigurovaná na souborovém serveru se systémem Windows Server. Uchovává informace o clusteringu v souboru witness.log, ale neukládá kopii databáze clusteru.
- Disk s kopií clusteru – malý clusterovaný disk, který je ve skupině Úložiště k dispozici pro cluster. Tento disk je vysoce dostupný a může provést převzetí služeb při selhání mezi uzly. Obsahuje kopii databáze clusteru. Disk s kopií clusteru není u Prostory úložiště s přímým přístupem podporovaný.
Přehled kvora fondu
Právě jsme mluvili o kvoru clusteru, který funguje na úrovni clusteru. Teď se pojďme ponořit do kvora fondu, který funguje na úrovni fondu (tj. můžete ztratit uzly a jednotky a nechat fond zůstat vzhůru). Fondy úložiště byly navrženy tak, aby se používaly v clusterovaných i ne clusterových scénářích, což je důvod, proč mají jiný mechanismus kvora.
Následující tabulka poskytuje přehled výsledků kvora fondu pro jednotlivé scénáře:
Uzly serveru | Může přežít selhání jednoho uzlu serveru | Může přežít selhání jednoho uzlu serveru a pak druhý | Dokáže přežít dvě selhání souběžných uzlů serveru. |
---|---|---|---|
2 | Yes | No | Ne |
2 + svědek | Yes | No | Ne |
3 | Yes | No | Ne |
3 + svědek | Yes | No | Ne |
4 | Yes | No | Ne |
4 + svědek | Ano | Ano | Yes |
5 a vyšší | Ano | Ano | Yes |
Jak funguje kvorum fondu
Pokud jednotky selžou nebo když některé podmnožina jednotek ztratí kontakt s jinou podmnožinou, musí přeživší jednotky hostující metadata ověřit, že tvoří většinu fondu, aby zůstaly online. Pokud to nemůžou ověřit, přejdou do režimu offline. Fond je entita, která přejde do režimu offline nebo zůstane online na základě toho, jestli má dostatek disků pro kvorum (50 % + 1). Databáze clusteru může být +1, pokud samotný cluster představuje citaci.
Kvorum fondu ale funguje jinak než kvorum clusteru následujícími způsoby:
- Fond vybere podmnožinu jednotek na uzel pro hostování metadat.
- Fond používá k přerušení vazeb databázi clusteru.
- Fond nemá dynamické kvorum.
- Fond neimplementuje vlastní verzi odebrání hlasování.
Příklady
Čtyři uzly se symetrickým rozložením
Každý z 16 jednotek má jeden hlas a dva uzly mají také jeden hlas (protože se jedná o vlastníka zdroje fondu). Většina je určena z celkového počtu 16 hlasů. Pokud uzly tři a čtyři jdou dolů, přeživší podmnožina má 8 jednotek a vlastník prostředků fondu, což je 9/16 hlasů. Takže bazén přežije.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ano.
- Může přežít dvě selhání serveru najednou: Ano.
Čtyři uzly se symetrickým rozložením a selháním jednotky
Každý z 16 jednotek má jeden hlas a uzel 2 má také jeden hlas (protože se jedná o vlastníka zdrojů fondu). Většina je určena z celkového počtu 16 hlasů. Za prvé, jednotka 7 se zhasne. Pokud uzly tři a čtyři jdou dolů, přeživší podmnožina má 7 jednotek a vlastník prostředků fondu, což je 8/16 hlasů. Takže fond nemá většinu a jde dolů.
- Může přežít jedno selhání serveru: Ano.
- Může přežít selhání jednoho serveru a pak druhý: Ne.
- Může přežít dvě selhání serveru najednou: Ne.
Doporučení kvora fondu
- Ujistěte se, že je každý uzel v clusteru symetrický (každý uzel má stejný počet jednotek).
- Povolte trojcestné zrcadlení nebo duální paritu, abyste mohli tolerovat selhání dvou uzlů a zachovat virtuální disky online.
- Pokud je mimo provoz více než dva uzly nebo dva uzly a disk na jiném uzlu jsou mimo provoz, svazky nemusí mít přístup ke všem třem kopiím dat, a proto jsou převezměny do offline režimu a nejsou dostupné. Doporučuje se rychle přenést servery nebo nahradit disky, aby byla zajištěna maximální odolnost všech dat ve svazku.