Klíčové aspekty služby Azure Data Lake Storage
Azure Storage nabízí celou řadu možností úložiště pro vaše data. Tento článek obsahuje důležité informace, které vám pomůžou zvolit odpovídající úroveň přístupu, abyste mohli vyrovnávat náklady a výkon. Popisuje také správu životního cyklu úložiště, včetně funkcí a osvědčených postupů, které vám pomůžou efektivně používat úrovně přístupu.
Správa životního cyklu
Azure Storage nabízí různé úrovně přístupu, které můžete použít k ukládání dat objektů blob. Zvolte úroveň, která nejlépe vyhovuje vaší úloze a optimalizuje náklady.
K ukládání často přístupných dat použijte horká úroveň.
K ukládání zřídka používaných dat použijte chladnou vrstvu. Tato úroveň ukládá data nejméně po dobu 30 dnů.
K ukládání zřídka používaných nebo upravených dat použijte studenou vrstvu. Tato úroveň ukládá data nejméně po dobu 90 dnů. Úroveň Zřídkavý přístup má v porovnání se studenou úrovní nižší náklady na úložiště a vyšší náklady na přístup.
Použijte archivní vrstvu k ukládání zřídka používaných dat. Tato úroveň ukládá data nejméně po dobu 180 dnů. Přístup k datům může mít flexibilní požadavky na latenci, což znamená, že načtení dat může trvat hodiny.
Důležité
Úrovně přístupu online (horká, studená a studená) nemají kompromisy mezi spolehlivostí, zabezpečením, efektivitou provozu nebo efektivitou výkonu. Proto byste měli své rozhodnutí založit na nákladech na každý blob. Zvažte velikost dat přístupná úlohám, operační interakce a dobu před odstraněním blobu. Na základě těchto faktorů vyberte odpovídající úroveň pro každý datový blob. Další informace najdete v tématu Plánování a správa nákladů na Službu Blob Storage .
Při použití úrovní přístupu zvažte následující faktory:
Nastavte pouze horkou a studenou úroveň přístupu na úrovni účtu. Úroveň účtu nepodporuje archivní úroveň přístupu.
Nastavte horkou, studenou a archivní úroveň na úrovni objektu blob během nahrávání nebo po nahrání.
Data ve chladných a studených úrovních mají mírně nižší dostupnost, ale tyto úrovně nabízejí funkce, které se podobají vlastnostem horké úrovně, jako je vysoká odolnost, latence načítání a propustnost. U dat ve studených nebo studených úrovních jsou nižší dostupnost a vyšší náklady na přístup přijatelné pro snížení nákladů na úložiště v porovnání s horkou úrovní.
Archivní úložiště ukládá data offline a nabízí nejnižší náklady na úložiště. Kromě toho vznikají také nejvyšší náklady na obnovení a přístup k datům.
Další informace najdete v tématu Úrovně přístupu pro data objektů blob.
Důležité
Pro analýzy v cloudovém měřítku použijte vlastní mikroslužbu k implementaci správy životního cyklu. Pečlivě zvažte dopad přesunu uživatelsky zjistitelných dat do studeného úložiště. Přesuňte části datového jezera na chladnější vrstvu pouze pro dobře pochopitelné pracovní zátěže.
Připojení Data Lake
Každé datové jezero by mělo používat privátní koncové body, které integrujete do virtuální sítě cílové zóny dat. Pokud chcete zajistit přístup napříč cílovými zónami, připojte cílové zóny dat prostřednictvím partnerského vztahu virtuálních sítí. Toto připojení poskytuje optimální řešení z hlediska nákladů i řízení přístupu.
Další informace najdete v tématu Privátní koncové body a cílová zóna správy dat do cílové zóny dat.
Důležité
Zóna příjmu dat může mít přístup k datům v jiné zóně příjmu dat prostřednictvím propojení virtuálních sítí. Privátní koncové body navazují připojení spojené s každým účtem Data Lake. Doporučujeme vypnout veškerý veřejný přístup k jezerům a používat privátní koncové body. Provozní tým platformy by měl řídit síťové připojení napříč cílovými zónami dat.
Obnovitelné odstranění pro kontejnery
Měkké odstranění kontejnerů pomáhá chránit vaše data před náhodným nebo škodlivým smazáním. Pokud pro účet úložiště povolíte obnovitelné odstranění kontejneru, služba Storage uchovává odstraněné kontejnery a jejich obsah po určitou dobu. Během doby uchovávání dat můžete obnovit dříve odstraněné kontejnery. Tato akce také obnoví objekty blob, které byly v tomto kontejneru, když byl odstraněn.
Povolením následujících funkcí ochrany dat můžete vylepšit komplexní ochranu dat objektů blob:
K obnovení odstraněného kontejneru použijte měkké odstranění kontejneru. Viz Povolení a správa softwarového odstranění kontejnerů.
K obnovení odstraněného objektu blob nebo jeho verze použijte funkci měkkého odstranění objektu blob. Další informace najdete v tématu Povolení a správa funkce soft delete pro objekty blob.
Upozorňující
Po odstranění účtu úložiště nemůžete tento krok vrátit zpět. Zrušitelné odstranění kontejneru nechrání před odstraněním účtu úložiště, pouze chrání proti odstranění kontejnerů v rámci účtu. Pokud chcete chránit účet úložiště před odstraněním, nakonfigurujte zámek prostředku účtu úložiště. Další informace najdete v tématu Uzamčení prostředků, abyste zabránili neočekávaným změnám.
Sledování
V datové přistávací zóně odešlete veškeré monitorování do správy předplatného přistávací zóny Azure k analýze.
Další informace najdete v tématu Monitorování prostředků Azure pomocí služby Azure Monitor a Monitorování služby Blob Storage.
Položky protokolu se vytvářejí jenom pro požadavky na koncový bod služby. Protokolují se následující typy ověřených požadavků:
- Úspěšné požadavky
- Neúspěšné požadavky, včetně vypršení časových limitů, omezování, problémů se sítí, problémů s autorizací a dalších chyb
- Požadavky, které používají sdílený přístupový podpis (SAS) nebo OAuth, včetně neúspěšných a úspěšných požadavků
- Požadavky na analýzu dat, jako jsou klasická data protokolů v kontejneru
$logs
a data metrik tříd v$metric
tabulkách
Požadavky provedené samotnou službou úložiště, jako je vytvoření nebo odstranění protokolu, se nezaprotokolují. Protokolují se následující typy anonymních požadavků:
- Úspěšné požadavky
- Chyby serveru
- Chyby vypršení časového limitu u klientů i serveru
- Neúspěšné požadavky HTTP GET, které mají kód chyby 304 (
Not Modified
)
Jiné neúspěšné anonymní požadavky se nezaprotokolují.
Důležité
Nastavte výchozí zásady monitorování tak, aby auditovat úložiště a odesílaly protokoly do předplatného pro správu na podnikové úrovni.
Zabezpečení zón Data Lake
Pro zóny Data Lake doporučujeme následující vzory zabezpečení:
Přímé využití umožňuje přístup k datům pouze pomocí jmen hlavního zabezpečení (SPN). Doporučujeme používat spravované identity.
Rozšířené použití umožňuje přístup k datům pouze pomocí SPN. Doporučujeme používat spravované identity.
Řízené využití umožňuje přístup k datům pomocí názvů hlavních služeb (SPN) a uživatelských hlavních názvů (UPN).
Další informace naleznete v tématu Model řízení přístupu v Data Lake Storage.