Optimalizace úložiště s využitím odstranění duplicitních dat ReFS a komprese v Azure Local
Platí pro: Azure Local 2311.2 a novější
Tento článek popisuje funkci odstranění duplicitních dat odolného systému souborů (ReFS) a funkci komprese a způsob použití této funkce v Azure Local k optimalizaci úložiště.
Co je odstranění duplicitních dat a komprese ReFS?
Odstranění duplicitních dat a komprese ReFS je funkce optimalizace úložiště, která pomáhá optimalizovat využití úložiště a snížit náklady na úložiště. Odstranění duplicitních dat používejte speciálně pro aktivní úlohy citlivé na výkon nebo úlohy náročné na čtení, jako je infrastruktura virtuálních klientských počítačů Azure (VDI) v Azure Local. U méně náročných úloh na výkon můžete použít kombinaci odstranění duplicitních dat a komprese nebo pouze komprese.
Tato funkce používá klonování bloků ReFS k omezení přesunu dat a povolení operací pouze s metadaty. Funkce funguje na úrovni datového bloku a v závislosti na velikosti systému používá pevnou velikost bloku. Komprimační modul vygeneruje heat mapu, která identifikuje, jestli má blok nárok na kompresi a optimalizuje využití procesoru.
Odstranění duplicitních dat a kompresi ReFS můžete spustit jako jednorázovou úlohu nebo ji automatizovat s naplánovanými úlohami. Tato funkce funguje se systémy all-flash i hybridními systémy a podporuje různá nastavení odolnosti, jako je dvoucestné zrcadlo, vnořené dvoucestné zrcadlo, trojcestné zrcadlení a akcelerovaná parita zrcadlení.
Zaměstnanecké výhody
Tady jsou výhody použití odstranění duplicitních dat a komprese ReFS:
- Úspora úložiště pro aktivní úlohy Navržené pro aktivní úlohy, jako je VDI, zajišťují efektivní výkon v náročných prostředích.
- Více režimů. Funguje ve třech režimech: pouze odstranění duplicitních dat (výchozí režim), pouze komprese a odstranění duplicit a komprese, což umožňuje optimalizaci na základě vašich potřeb.
- Přírůstkové odstranění duplicitních dat Odstranění duplicitních dat vytváří pouze nová nebo změněná data na rozdíl od kontroly celého svazku pokaždé, optimalizaci doby trvání úlohy a snížení dopadu na výkon systému.
Požadavky
Než začnete, ujistěte se, že jsou splněné následující požadavky:
- Máte přístup k místní instanci Azure, která je nasazená a zaregistrovaná.
- Máte sdílený svazek clusteru (CSV) vytvořený v instanci a máte k němu přístup.
- Sdílený svazek clusteru ještě nemá povolenou funkci Odstranění duplicitních dat windows.
Použití odstranění duplicitních dat a komprese ReFS
Odstranění duplicitních dat a kompresi ReFS můžete použít přes Windows Admin Center nebo PowerShell. PowerShell umožňuje ruční i automatizované úlohy, zatímco Windows Admin Center podporuje pouze naplánované úlohy. Bez ohledu na metodu můžete přizpůsobit nastavení úlohy a využít sledování změn souborů k rychlejším následným spuštěním.
Poznámka:
Pro úlohy, u kterých je potřeba zvážit výkon, doporučujeme používat pouze odstranění duplicitních dat, nikoli kompresi nebo kombinaci obojího.
Povolení a spuštění odstranění duplicitních dat a komprese ReFS
Ve Windows Admin Center můžete vytvořit plán pro odstranění duplicitních dat ReFS, který se bude spouštět na existujícím svazku nebo na novém svazku během vytváření svazku. Povolení komprese se ale podporuje jenom prostřednictvím PowerShellu.
Pokud chcete povolit odstranění duplicitních dat ReFS přes Windows Admin Center a nastavit plán, kdy se má spustit, postupujte takto:
Připojte se k systému a v podokně Nástroje vlevo vyberte Svazky.
Na stránce Svazky vyberte kartu Inventář, vyberte příslušný svazek a pak vyberte Nastavení. Pokud chcete pro nový svazek zapnout odstranění duplicitních dat ReFS, vyberte + Vytvořit.
V podokně Nastavení svazku vpravo v rozevíracím seznamu Další možnosti zaškrtněte políčko Použít odstranění duplicitních dat ReFS.
Vyberte dny v týdnu, kdy se má odstranění duplicitních dat reFS spustit, čas spuštění úlohy a maximální doba trvání (výchozí hodnota je neomezená) a pak vyberte Uložit.
Následující snímek obrazovky ukazuje, že odstranění duplicitních dat ReFS se spustí v pátek a sobotu v 10:00 s maximální dobou trvání 2 hodiny od 27. 9. 2024. Pokud se datum zahájení změnilo na pondělí 30. 9. 2024, první spuštění bude 10.4.2024 10:00, protože první pátek po 30. 9. 2024.
Ověřte změny v části Vlastnosti svazku. Plán se zobrazí v části Vlastnosti a zobrazí rozpis úspor a další naplánovaný čas spuštění. Tyto úspory se aktualizují po každém spuštění a v grafech v části Výkon můžete sledovat dopad na výkon. Pokud je komprese povolená přes PowerShell, jeho úspory se zobrazí také v části Vlastnosti .
Pozastavení naplánovaných úloh
Pozastavení plánu zruší všechny spuštěné úlohy a v budoucnu zastaví naplánovaná spuštění. Tato možnost zachovává odstranění duplicitních dat ReFS a metadata související s kompresí a nadále sleduje změny souborů pro optimalizovaná budoucí spuštění. Plán můžete kdykoli obnovit se zachováním nastavení plánu.
Pokud chcete pozastavit naplánované úlohy pomocí Centra pro správu Windows, postupujte takto:
Připojte se k systému a v podokně Nástroje vlevo vyberte Svazky.
Na stránce Svazky vyberte kartu Inventář, vyberte příslušný svazek a pak vyberte Nastavení.
V podokně Nastavení svazku vpravo v rozevíracím seznamu Další možnosti zrušte zaškrtnutí políčka Nastavit plán a pak vyberte Uložit.
Zakázání odstranění duplicitních dat ReFS a komprese svazku
Zakázání odstranění duplicitních dat ReFS a komprese svazku zastaví všechna probíhající spuštění a zruší budoucí naplánované úlohy. Kromě toho se související metadata svazku nezachovají a sledování změn souborů se zastaví.
Poznámka:
Když tuto funkci zakážete, neodebere odstranění duplicit ani kompresi, protože všechny operace probíhají ve vrstvě metadat. V průběhu času se odstraněná data vrátí do původního stavu, protože svazek způsobuje čtení a zápisy. Pokud chcete data dekomprimovat, ujistěte se, že je k dispozici dostatek kapacity, a pomocí nástroje ReFSUtil proveďte následující operaci.
refsutil compression /c /f NONE <vol>
Pokud chcete funkci zakázat pomocí Centra pro správu Windows, postupujte takto:
Připojte se k systému a v podokně Nástroje vlevo vyberte Svazky.
Na stránce Svazky vyberte kartu Inventář, vyberte příslušný svazek a pak vyberte Nastavení.
V podokně Nastavení svazku vpravo v rozevíracím seznamu Další možnosti zrušte zaškrtnutí políčka Použít odstranění duplicitních dat ReFS a pak vyberte Uložit.
Nejčastější dotazy
Tato část odpovídá na nejčastější dotazy týkající se odstranění duplicitních dat a komprese ReFS.
Liší se funkce odstranění duplicitních dat a komprese ReFS od Odstranění duplicitních dat windows?
Ano, tato funkce se zcela liší od funkce Odstranění duplicitních dat systému Windows.
Důležité
Nepodporujeme současné povolení odstranění duplicitních dat ReFS i komprese i Odstranění duplicitních dat Windows.
Odstranění duplicitních dat a komprese ReFS je navržené pro aktivní úlohy a zaměřuje se na minimalizaci dopadu na výkon po optimalizaci. Na rozdíl od Odstranění duplicitních dat systému Windows nepoužívá odstranění duplicitních dat ReFS a komprese úložiště bloků dat k ukládání odstraněných dat a není zahrnuté žádné fyzické přesuny dat. Tato funkce spoléhá na klonování bloků ReFS k povolení operací jen s metadaty. Odstranění duplicitních dat windows může lépe ušetřit úložiště díky použití proměnných velikostí bloků, je také vhodné pro širší škálu typů úloh, jako jsou souborové servery pro obecné účely (GPFS), cíle zálohování a další.
Jaké jsou fáze odstranění duplicitních dat a komprese ReFS?
Proces optimalizace se skládá z následujících fází, které probíhají postupně a závisí na zadaném režimu. Pokud optimalizační spuštění dosáhne limitu doby trvání, nemusí se komprese spustit.
Inicializace. V této fázi se svazek úložiště zkontroluje a identifikuje redundantní bloky dat.
Odstranění duplicitních dat V této fázi jsou redundantní bloky s jednou instancí a sledovány pomocí klonování bloků ReFS.
Komprese. V této fázi se vygeneruje heat mapa, která identifikuje, jestli má blok nárok na kompresi. Výchozí nastavení komprimují zřídka daná nebo studená data, aby se snížila jejich velikost. Úrovně komprese můžete změnit a upravit rozsah bloků způsobilých ke kompresi.
Co se stane, když se dosáhne limitu doby trvání, než se svazek plně optimalizuje?
Limit doby trvání je zaveden, aby se zabránilo jakémukoli dopadu na výkon úloh zákazníků způsobených úlohou optimalizace během pracovní doby. Služba odstranění duplicitních dat monitoruje optimalizované části svazku a úpravy příchozích souborů. Tato data se využívají v budoucích úlohách, aby se zkrátila doba optimalizace. Pokud je například svazek zpracován pouze 30 % při prvním spuštění z důvodu limitu doby trvání, následné spuštění řeší zbývající 70 % a všechna nová data.
Známé problémy
Následující část uvádí známé problémy, které aktuálně existují s odstraněním duplicitních dat a kompresí ReFS.
Pokud je povolená komprese, může použití parametru -FullRun
u úloh po prvním spuštění optimalizace způsobit zablokování v systému.
Stav: Otevřená.
-FullRun
Nepoužívejte v ručně spuštěných úlohách, pokud není Type
.Dedup
Pokud chcete tento problém zmírnit, postupujte podle těchto kroků jako dočasné alternativní řešení:
Zakažte odstranění duplicitních dat ReFS a kompresi svazku:
Disable-ReFSDedup -Volume <path>
Dekomprese svazku pomocí
refsutil
:refsutil compression /c /f NONE <vol>
V případě potřeby znovu povolte odstranění duplicitních dat ReFS a kompresi jediným režimem
Dedup
:Enable-ReFSDedup -Volume <path> -Type Dedup
Plánování úloh pro souběžné spouštění na více sdílených svazcích clusteru v jednom systému může potenciálně aktivovat pohyby csv a negativně ovlivnit výkon.
Stav: Otevřená.
Jako doporučený osvědčený postup zvažte vytvoření počátečního času úloh, abyste se vyhnuli překrývání. Pokud ale všechny úlohy musí běžet současně, upravte přidělení procesoru na každou úlohu napříč všemi sdílené svazky clusteru tak, aby bylo nižší než 50 % celkového využití procesoru systému. Mějte na paměti, že uložení omezení procesoru může vést k delší době provádění úloh.
Odstranění duplicitních dat reFS a úloha komprese se dokončila (úspěšně nebo byla zrušena) a úspory úložiště nejsou uvedené v Get-ReFSDedupStatus
centru Windows Admin Center.
Stav: Vyřešeno.
Dočasným alternativním řešením tohoto problému je inicializovat jednorázovou úlohu a okamžitě aktualizovat výsledky.
Start-ReFSDedupJob -Volume <path>
Odesílání událostí sledování událostí pro Windows (ETW) přestalo monitorovat po zakázání odstranění duplicit ReFS a kompresi svazku.
Stav: Vyřešeno.
Jakmile je odstranění duplicitních dat a komprese ReFS na svazku zakázané, kanál ETW pro protokoly odstranění duplicitních dat ReFS opakovaně zastavil monitorování událostí. Kvůli tomuto problému ale neočekáváme významný dopad na využití.
Událost selhání úlohy se nezaprotokoluje, pokud se svazek během komprese přesune do jiného uzlu.
Stav: Vyřešeno.
Pokud se sdílený svazek clusteru přesune do jiného počítače systému, zatímco probíhá komprese, úloha se nezdaří, do kanálu odstranění duplicitních dat ReFS se nezaprotokoluje. Kvůli tomuto problému ale neočekáváme významný dopad na využití.