Porovnání Azure Data Lake Store s Azure Blob Storage

Dokončeno

Ve službě Azure Blob Storage můžete ukládat velké objemy nestrukturovaných dat ("objekt") do plochého oboru názvů v kontejneru objektů blob. Názvy objektů blob můžou obsahovat znaky /, které slouží k uspořádání objektů blob do virtuálních složek, ale pokud jde o možnosti správy objektů blob, jsou objekty blob uložené jako hierarchie na jedné úrovni v plochém oboru názvů.

Diagram úložiště objektů blob s plochým oborem názvů

K datům můžete přistupovat pomocí protokolu HTTP nebo HTTPs.

Azure Data Lake Storage Gen2 vychází z úložiště objektů blob a optimalizuje vstupně-výstupní operace s velkým objemem dat pomocí hierarchického oboru názvů, který uspořádá data objektů blob do adresářů a ukládá metadata o každém adresáři a souborech v něm. Díky této struktuře se můžou operace, jako jsou přejmenování nebo odstranění adresářů, provádět jedinou atomickou operací. Naproti tomu v plochých oborech názvů je potřeba několik operací úměrně počtu objektů ve struktuře. V hierarchických oborech názvů jsou data uspořádaná, což při použití v analýzách poskytuje lepší výkon při ukládání a načítání a snižuje náklady na analýzu.

Diagram úložiště objektů blob s hierarchickým oborem názvů

Tip

Pokud chcete ukládat data, ale nechcete je analyzovat, nastavte účet úložiště jako účet Azure Blob Storage tak, že možnost Hierarchický obor názvů nastavíte na Zakázáno. Úložiště objektů blob můžete použít také k archivaci zřídka používaných dat nebo k uložení prostředků webu, jako jsou obrázky a média.

Pokud provádíte analýzy dat, nastavte účet úložiště jako účet Azure Data Lake Storage Gen2 tak, že možnost Hierarchický obor názvů nastavíte na Povoleno. Služba Azure Data Lake Storage Gen2 je integrovaná do platformy Azure Storage, a proto můžou aplikace používat pro přístup k datům buď rozhraní API objektů blob, nebo rozhraní API systému souborů Azure Data Lake Storage Gen2.