Sdílet prostřednictvím


Odolnost proti chybám a efektivita úložiště v clusterech Azure Stack HCI a Windows Server

Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019

Důležité

Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.

Tento článek vysvětluje dostupné možnosti odolnosti a popisuje požadavky na škálování, efektivitu úložiště a obecné výhody a kompromisy každé z nich.

Přehled

Prostory úložiště s přímým přístupem poskytuje odolnost proti chybám, často označovanou jako odolnost vašich dat. Jeho implementace je podobná RAID, s výjimkou distribuovaných mezi servery a implementovaných v softwaru.

Stejně jako u RAID existuje několik různých způsobů, jak to Prostory úložiště, což umožňuje různé kompromisy mezi odolností proti chybám, efektivitou úložiště a složitostí výpočetních prostředků. Tyto široce spadají do dvou kategorií: "zrcadlení" a "parita", druhá se někdy nazývá "kódování mazání".

Zrcadlení

Zrcadlení zajišťuje odolnost proti chybám tím, že uchovává více kopií všech dat. Nejvíce se podobá raid-1. Jak jsou tato data prokládání a umístění non-triviální (viz tento blog dozvědět více), ale je naprosto pravda říci, že všechna data uložená pomocí zrcadlení jsou napsána v celé jeho celé době. Každá kopie se zapisuje na jiný fyzický hardware (různé jednotky na různých serverech), u nichž se předpokládá, že selžou nezávisle.

Můžete si vybrat mezi dvěma příchutěmi zrcadlení – "obousměrně" a "trojcestně".

Dvoucestný zrcadlový svazek

Dvoucestné zrcadlení zapisuje dvě kopie všeho. Efektivita úložiště je 50 procent – k zápisu 1 TB dat potřebujete alespoň 2 TB fyzické kapacity úložiště. Stejně tak potřebujete aspoň dva hardwarové domény selhání – s Prostory úložiště s přímým přístupem, to znamená dva servery.

dvoucestné zrcadlo

Upozorňující

Pokud máte více než dva servery, doporučujeme místo toho použít trojcestné zrcadlení.

Třícestný zrcadlový svazek

Třícestné zrcadlení zapisuje tři kopie všeho. Efektivita úložiště je 33,3 % – k zápisu 1 TB dat potřebujete alespoň 3 TB fyzické kapacity úložiště. Stejně tak potřebujete aspoň tři hardwarové domény selhání – s Prostory úložiště s přímým přístupem, to znamená tři servery.

Třícestné zrcadlení může bezpečně tolerovat alespoň dva hardwarové problémy (jednotku nebo server) najednou. Pokud například restartujete jeden server, když náhle selže jiná jednotka nebo server, všechna data zůstanou bezpečná a nepřetržitě přístupná.

třícestné zrcadlo

Parita

Paritní kódování, často označované jako kódování mazání, poskytuje odolnost proti chybám pomocí bitové aritmetické metody, která může být výrazně komplikovaná. Způsob, jak to funguje, je méně zřejmé než zrcadlení a existuje mnoho skvělých online zdrojů (například tento třetí strana Fimmies Guide to Mazání Kódování), které vám můžou pomoct získat nápad. Stačí říct, že poskytuje lepší efektivitu úložiště bez ohrožení odolnosti proti chybám.

Prostory úložiště nabízí dvě varianty parity – "jednoduchou" paritu a "duální" paritu, druhá využívá pokročilou techniku nazvanou "kódy místního obnovení" ve větším měřítku.

Důležité

Pro většinu úloh citlivých na výkon doporučujeme používat zrcadlení. Další informace o vyvážení výkonu a kapacity v závislosti na úloze najdete v tématu Plánování svazků.

Jednoduchá parita

Jednoduchá parita uchovává pouze jeden bitový paritní symbol, který poskytuje odolnost proti chybám pouze proti jednomu selhání najednou. Nejvíce se podobá raid-5. Pokud chcete použít jednu paritu, potřebujete aspoň tři hardwarové domény selhání – s Prostory úložiště s přímým přístupem, to znamená tři servery. Vzhledem k tomu, že trojcestné zrcadlení poskytuje větší odolnost proti chybám ve stejném měřítku, nedoporučujeme používat jednu paritu. Pokud ale trváte na jeho používání a je plně podporovaná, je tam.

Upozorňující

Nedoporučujeme používat jedinou paritu, protože může bezpečně tolerovat pouze jedno selhání hardwaru najednou: pokud restartujete jeden server, když náhle selže jiná jednotka nebo server, dojde k výpadku. Pokud máte jenom tři servery, doporučujeme použít třícestné zrcadlení. Pokud máte čtyři nebo více, přečtěte si další část.

Duální parita

Duální parita implementuje kódy oprav chyb Reed-Solomon, aby zachovaly dva bitové paritní symboly, což poskytuje stejnou odolnost proti chybám jako trojcestné zrcadlení (tj. až dvě selhání najednou), ale s lepší efektivitou úložiště. Nejvíce se podobá RAID-6. Pokud chcete použít duální paritu, potřebujete aspoň čtyři domény selhání hardwaru – s Prostory úložiště s přímým přístupem, to znamená čtyři servery. V takovém měřítku je efektivita úložiště 50 % – k ukládání 2 TB dat potřebujete 4 TB fyzické kapacity úložiště.

duální parita

Efektivita úložiště duální parity zvyšuje počet domén selhání hardwaru, které máte, z 50 % až 80 %. Například při sedmi (s Prostory úložiště s přímým přístupem to znamená sedm serverů) se efektivita přeskočí na 66,7 % – pro uložení 4 TB dat potřebujete jen 6 TB fyzické kapacity úložiště.

duální parita– široká

V části Souhrn najdete efektivitu kódů duální strany a místního obnovení v každém měřítku.

Kódy místního obnovení

Prostory úložiště zavádí pokročilou techniku vyvinutou společností Microsoft Research s názvem "kódy místního obnovení" nebo LRC. Duální parita ve velkém měřítku využívá LRC k rozdělení kódování a dekódování do několika menších skupin, aby se snížila režie potřebná k vytvoření zápisu nebo zotavení při selhání.

U pevných disků (HDD) je velikost skupiny čtyři symboly; s jednotkami SSD (Solid-State Drive), velikost skupiny je šest symbolů. Tady je příklad, jak vypadá rozložení s pevnými disky a 12 doménami selhání hardwaru (tj. 12 serverů) – existují dvě skupiny čtyř datových symbolů. Dosahuje 72,7% efektivity úložiště.

kódy místního obnovení

Doporučujeme tento podrobný, ale velmi čitelný návod , jak kódy místního obnovení zpracovávají různé scénáře selhání a proč jsou atraktivní, Claus Joergensen.

Zrcadlově akcelerovaná parita

Svazkem Prostory úložiště s přímým přístupem může být zrcadlení částí a parita částí. Zapisuje nejprve v zrcadlené části a postupně se přesunou do paritní části později. Díky tomu se zrcadlení využívá ke zrychlení kódování mazání.

Pokud chcete kombinovat trojcestné zrcadlení a duální paritu, potřebujete alespoň čtyři domény selhání, což znamená čtyři servery.

Efektivita úložiště zrcadlově akcelerované parity je mezi tím, co byste získali od použití veškerého zrcadlení nebo veškeré parity, a závisí na poměrech, které zvolíte.

Důležité

Pro většinu úloh citlivých na výkon doporučujeme používat zrcadlení. Další informace o vyvážení výkonu a kapacity v závislosti na úloze najdete v tématu Plánování svazků.

Shrnutí

Tato část shrnuje typy odolnosti dostupné v Prostory úložiště s přímým přístupem, minimální požadavky na škálování pro použití jednotlivých typů, kolik selhání může každý typ tolerovat, a odpovídající efektivitu úložiště.

Typy odolnosti

Odolnost Odolnost proti chybám Efektivita úložiště
Dvoucestný zrcadlový svazek 0 50.0%
Třícestný zrcadlový svazek 2 33,3 %
Duální parita 2 50.0% - 80.0%
Smíšené 2 33.3% - 80.0%

Minimální požadavky na škálování

Odolnost Minimální požadované domény selhání
Dvoucestný zrcadlový svazek 2
Třícestný zrcadlový svazek 3
Duální parita 4
Smíšené 4

Tip

Pokud nepoužíváte odolnost skříně nebo racku proti chybám, počet domén selhání odkazuje na počet serverů. Počet jednotek na každém serveru nemá vliv na typy odolnosti, které můžete použít, pokud splňujete minimální požadavky na Prostory úložiště s přímým přístupem.

Efektivita duální parity pro hybridní nasazení

Tato tabulka ukazuje efektivitu úložiště duální parity a kódů místního obnovení v každém měřítku pro hybridní nasazení, která obsahují jak pevné disky (HDD), tak jednotky SSD (Solid-State Drive).

Domény selhání Rozložení Efektivita
2
3
4 RS 2+2 50.0%
5 RS 2+2 50.0%
6 RS 2+2 50.0%
7 RS 4+2 66.7%
8 RS 4+2 66.7%
9 RS 4+2 66.7%
10 RS 4+2 66.7%
11 RS 4+2 66.7%
12 LRC (8, 2, 1) 72.7%
13 LRC (8, 2, 1) 72.7%
14 LRC (8, 2, 1) 72.7%
15 LRC (8, 2, 1) 72.7%
16 LRC (8, 2, 1) 72.7%

Efektivita duální parity pro nasazení typu all-flash

Tato tabulka ukazuje efektivitu úložiště duální parity a kódů místního obnovení v každém měřítku pro nasazení typu all-flash, která obsahují pouze jednotky SSD (Solid-State Drive). Rozložení parity může používat větší velikosti skupin a dosáhnout lepší efektivity úložiště v konfiguraci typu all-flash.

Domény selhání Rozložení Efektivita
2
3
4 RS 2+2 50.0%
5 RS 2+2 50.0%
6 RS 2+2 50.0%
7 RS 4+2 66.7%
8 RS 4+2 66.7%
9 RS 6+2 75,0 %
10 RS 6+2 75,0 %
11 RS 6+2 75,0 %
12 RS 6+2 75,0 %
13 RS 6+2 75,0 %
14 RS 6+2 75,0 %
15 RS 6+2 75,0 %
16 LRC (12, 2, 1) 80.0%

Příklady

Pokud nemáte jenom dva servery, doporučujeme použít trojcestné zrcadlení nebo duální paritu, protože nabízejí lepší odolnost proti chybám. Konkrétně zajišťují, aby všechna data zůstala v bezpečí a nepřetržitě přístupná i v případě, že dvě domény selhání – s Prostory úložiště s přímým přístupem, což znamená, že na dva servery – mají vliv souběžná selhání.

Příklady, kde všechno zůstává online

Těchto šest příkladů ukazuje, jaké trojcestné zrcadlení a/nebo duální parita může tolerovat.

  • 1. Ztráta jedné jednotky (včetně jednotek mezipaměti)
  • 2. Došlo ke ztrátě jednoho serveru

příklady odolnosti proti chybám – 1 a 2

  • 3. Došlo ke ztrátě jednoho serveru a jedné jednotky
  • 4. Dvě jednotky ztracené na různých serverech

příklady odolnosti proti chybám – 3 a 4

  • 5. Ztráta více než dvou jednotek, pokud jsou ovlivněny maximálně dva servery
  • 6. Došlo ke ztrátě dvou serverů

příklady odolnosti proti chybám-5-a-6

... v každém případě zůstanou všechny svazky online. (Ujistěte se, že cluster udržuje kvorum.)

Příklady, kde všechno přejde do offline režimu

V průběhu své životnosti může Prostory úložiště tolerovat libovolný počet selhání, protože po každém z nich obnoví plnou odolnost za dostatek času. Na většinu dvou domén selhání ale může být v libovolném okamžiku bezpečně ovlivněno selháními. Níže jsou uvedeny příklady toho, co třícestné zrcadlení nebo duální parita nemůže tolerovat.

  • 7. Ztráta jednotek na třech nebo více serverech najednou
  • 8. Tři nebo více serverů se ztratily najednou

příklady odolnosti proti chybám – 7 a 8

Využití

Podívejte se na Vytvoření svazků.

Další kroky

Další informace o tématech uvedených v tomto článku najdete v následujících tématech: