Azure Data Lake Store と Azure Blob Storage を比較する

完了

Azure Blob Storage では、BLOB コンテナー内のフラット型名前空間に、大量の非構造化 ("オブジェクト") データを格納できます。 BLOB 名に "/" 文字を含めることで、BLOB を仮想 "フォルダー" に整理できますが、BLOB の管理しやすさの観点から、BLOB はフラット型名前空間の単一レベル階層として格納されます。

フラット型名前空間を使う BLOB ストアの図。

このデータには、HTTP または HTTPS を使ってアクセスできます

Azure Data Lake Storage Gen2 は、BLOB ストレージが基になっており、階層型名前空間を使って BLOB データを "ディレクトリ" に整理し、各ディレクトリとその中のファイルに関するメタデータを格納することにより、大量データの I/O を最適化します。 この構造により、ディレクトリの名前変更や削除などの操作が 1 回のアトミック操作で実行できます。 これに対し、フラット型名前空間では、構造内のオブジェクトの数に比例した複数回の操作が必要です。 階層型名前空間ではデータが整理された状態で維持されているので、分析のユース ケースにおいて保存と取得のパフォーマンスが向上するので、分析のコストを削減できます。

階層型名前空間を使う BLOB ストアの図。

ヒント

データを分析せずにデータを格納するユース ケースの場合は、[階層型の名前空間] オプションを [無効] に設定して、ストレージ アカウントを Azure Blob Storage アカウントとして設定します。 ほとんど使用しないデータをアーカイブする場合やイメージやメディアなどの Web サイト資産を格納するには Blob ストレージを使用することもできます。

データを分析する場合は、[階層型の名前空間] オプションを [有効] に設定して、Azure Data Lake Storage Gen2 アカウントとしてストレージ アカウントを設定する必要があります。 Azure Data Lake Storage Gen2 は Azure Storage プラットフォームに統合されているため、アプリケーションは Blob API または Azure Data Lake Storage Gen2 ファイル システム API のいずれかを使用してデータにアクセスします。