Azure HDInsight クラスターで使用するストレージ オプションを比較する
HDInsight クラスターを作成する際、次のいくつかの異なる Azure Storage サービスを選択できます。
この記事では、これらのストレージの種類とそれらの固有の機能の概要を提供します。
ストレージの種類と機能
次の表は、HDInsight のさまざまなバージョンでサポートされている Azure Storage サービスをまとめたものです。
ストレージ サービス | アカウントの種類 | 名前空間の種類 | サポートされているサービス | サポートされているパフォーマンス レベル | サポートされているアクセス層 | HDInsight のバージョン | クラスターの種類 |
---|---|---|---|---|---|---|---|
Azure Data Lake Storage Gen2 | 汎用 v2 | 階層構造 (ファイルシステム) | BLOB | Standard | ホット、クール、アーカイブ | すべて | Spark 2.1 および 2.2 を除くすべて |
Azure Storage | 汎用 v2 | Object | BLOB | Standard | ホット、クール、アーカイブ | All | All |
Azure Storage | 汎用 v1 | Object | BLOB | Standard | 該当なし | All | All |
Azure Storage | Blob Storage** | Object | ブロック BLOB | Standard | ホット、クール、アーカイブ | All | All |
Azure Data Lake Storage Gen1 | 該当なし | 階層構造 (ファイルシステム) | 該当なし | 該当なし | 該当なし | すべて | HBase を除くすべて |
Azure Storage | ブロック BLOB | Object | ブロック BLOB | Premium | 該当なし | すべて | 高速書き込みが可能なのは HBase のみ |
Azure Data Lake Storage Gen2 | ブロック BLOB | 階層構造 (ファイルシステム) | ブロック BLOB | Premium | 該当なし | すべて | 高速書き込みが可能なのは HBase のみ |
** HDInsight クラスターの場合、セカンダリ ストレージ アカウントのみに BlobStorage の種類を使用できます。ページ BLOB は、サポートされるストレージ オプションではありません。
ストレージ アカウントの種類について詳しくは、「Azure ストレージ アカウントの概要」をご覧ください。
Azure Storage アクセス層の詳細については、「Azure Blob Storage:Premium ストレージ層 (プレビュー)、ホット ストレージ層、クール ストレージ層、アーカイブ ストレージ層」を参照してください。
プライマリと省略可能なセカンダリ ストレージ用のサービスの組み合わせを使用してクラスターを作成することができます。 次の表に、HDInsight で現在サポートされているクラスター ストレージの構成をまとめています。
HDInsight のバージョン | プライマリ ストレージ | セカンダリ ストレージ | サポートされています |
---|---|---|---|
4.0、5.0、5.1 | General Purpose V1、General Purpose V2 | General Purpose V1、General Purpose V2、BlobStorage (ブロック BLOB) | はい |
4.0、5.0、5.1 | General Purpose V1、General Purpose V2 | Data Lake Storage Gen2 | いいえ |
4.0、5.0、5.1 | Data Lake Storage Gen2 | Data Lake Storage Gen2 | はい |
4.0、5.0、5.1 | Data Lake Storage Gen2* | General Purpose V1、General Purpose V2、BlobStorage (ブロック BLOB) | はい |
4.0、5.0、5.1 | Data Lake Storage Gen2 | Data Lake Storage Gen1 | いいえ |
4.0、5.0、5.1 | Data Lake Storage Gen1 | Data Lake Storage Gen1 | はい |
4.0、5.0、5.1 | Data Lake Storage Gen1 | General Purpose V1、General Purpose V2、BlobStorage (ブロック BLOB) | はい |
4.0、5.0、5.1 | Data Lake Storage Gen1 | Data Lake Storage Gen2 | いいえ |
4.0、5.0、5.1 | General Purpose V1、General Purpose V2 | Data Lake Storage Gen1 | いいえ |
*=すべてがクラスター アクセスに同じマネージド ID を使用するように設定されている限り、これは 1 つ以上の Data Lake Storage Gen2 である可能性があります。
Note
Data Lake Storage Gen2 プライマリ ストレージは、Spark 2.1 または 2.2 クラスターではサポートされていません。
データのレプリケーション
Azure HDInsight には顧客データは格納されません。 クラスターでの主な格納手段は、それに関連付けられているストレージ アカウントです。 クラスターを既存のストレージ アカウントにアタッチすることも、クラスターの作成プロセス中に新しいストレージ アカウントを作成することもできます。 新しいアカウントが作成されると、そのアカウントはローカル冗長ストレージ (LRS) アカウントとして作成され、リージョン内データ所在地要件 (セキュリティ センターで指定されたものを含む) を満たします。
HDInsight が 1 つのリージョンにデータを格納するように正しく構成されていることを検証するには、HDInsight に関連付けられているストレージ アカウントが LRS であるか、セキュリティ センターに記載された別のストレージ オプションであることを確認します。
注意
Azure Data Lake Storage Gen2 機能を備えた実行中のクラスターのプライマリまたはセカンダリ ストレージ アカウントのアップグレードはサポートされていません。 既存の HDInsight クラスターのストレージの種類を Data Lake Storage Gen2 に変更するには、クラスターを再作成し、階層型名前空間が有効なストレージ アカウントを選択する必要があります。