Premium ブロック BLOB ストレージアカウント

[アーティクル]
03/25/2023

Premium ブロック BLOB ストレージアカウントにより、高性能なハードウェア経由でデータを利用できます。データは、低待機時間のために最適化されたソリッドステートドライブ (SSD) に格納されています。 SSD は従来のハードドライブと比べ、スループットが高くなります。データがすぐにアクセス可能なメモリチップに格納されるので、ファイル転送がはるかに高速になります。ドライブのすべての部分に一度にアクセスできます。これに対し、ハードディスクドライブ (HDD) のパフォーマンスは、読み取り/書き込みヘッドへのデータの近さによって異なります。

ハイパフォーマンスワークロード

Premium ブロック BLOB ストレージアカウントは、高速の一貫した応答時間を必要とするワークロードや、1 秒あたりの入出力操作数 (IOP) が多いワークロードに最適です。ワークロードの例を次に示します。

対話型ワークロード。高度に対話型のリアルタイムアプリケーションでは、データをすばやく書き込む必要があります。 eコマースやマッピングアプリケーションでは、多くの場合に即時の更新とユーザーからのフィードバックが必要です。たとえば、eコマースアプリケーションでは、表示頻度の低い項目はキャッシュされない可能性があります。ただし、要求時には顧客に瞬時に表示される必要があります。対話型編集またはマルチプレーヤーオンラインゲームアプリケーションでは、リアルタイムの更新を提供することで、質の高いエクスペリエンスが維持されます。
IoT/ストリーミング分析. IoT シナリオでは、毎秒、小さな書き込み操作がクラウドにプッシュされる可能性があります。大量のデータが収集され、分析のために集計され、ほぼ瞬時に削除される場合があります。 Premium ブロック BLOB ストレージのインジェスト機能を利用すると、この種類のワークロードに効率的に対応できます。
人工知能/機械学習 (AI/ML) 。 AI/ML では、ビジュアル、音声、テキストなどのさまざまなデータの種類の使用と処理を扱います。このハイパフォーマンスコンピューティング型のワークロードでは大量のデータが処理されますが、データ分析のために迅速な応答と効率的なインジェスト時間が必要です。

コスト効率

Premium ブロック BLOB ストレージアカウントでは、Standard 汎用 v2 アカウントと比較してストレージコストは高くなりますが、トランザクションコストは低くなります。アプリケーションとワークロードで多数のトランザクションが実行される場合、特にワークロードの書き込み負荷が高い場合に、Premium ブロック BLOB ストレージのコスト効率が高くなる可能性があります。

ほとんどの場合、テラバイトあたり毎秒 (TPS/TB) 35 から 40 を超えるトランザクションを実行するワークロードは、この種類のアカウントに適しています。たとえば、ワークロードが 1 か月に 5 億回の読み取り操作と 1 億回の書き込み操作を実行する場合、次のように TPS/TB を計算できます。

1 秒あたりの書き込みトランザクション数 = 100,000,000 / (30 x 24 x 60 x 60) = 39 (最も近い整数に丸められます)
1 秒あたりの読み取りトランザクション数 = 500,000,000 / (30 x 24 x 60 x 60) = 193 (最も近い整数に丸められます)
1 秒あたりの合計トランザクション数 = 193 + 39 = 232
アカウントに、平均 5TB のデータがあったとすると、TPS/TB は 230/5 = 46 になります。

Note

価格は、操作ごと、およびリージョンごとに異なります。 Azure 料金計算ツールを使用して、Standard パフォーマンスレベルと Premium パフォーマンスレベルの価格を比較します。

次の表に、Premium ブロック BLOB ストレージアカウントのコスト効率を示しています。この表の数値は、Azure Data Lake Storage 対応 Premium ブロック BLOB ストレージアカウント (Azure Data Lake Storage の Premium レベルとも呼ばれます) に基づいています。各列は、1 か月のトランザクション数を表します。各行は、読み取りトランザクションであるトランザクションのパーセンテージを表します。表内の各セルは、読み取りトランザクションのパーセンテージと実行されたトランザクション数に関連付けたコスト削減率を示しています。

たとえば、お使いのアカウントが米国東部 2 リージョンにあり、そのアカウントでのトランザクションの数が 90M を超えていて、それらのトランザクションの 70% が読み取りトランザクションである場合、Premium ブロック BLOB ストレージアカウントの方がコスト効率が高くなります。

パフォーマンステーブル

Note

データ 1 TB ごとの 1 秒あたりのトランザクション数に基づいてコスト効率を評価する場合は、表の下部に示されている列見出しを使用できます。

Premium シナリオ

このセクションでは、いくつかの Azure Storage パートナーが Premium ブロック BLOB ストレージを使用する方法の実際の例を記載しています。また、それらの一部では、Azure Data Lake Storage も有効にしています。これにより、特定のシナリオでトランザクションのパフォーマンスをさらに高めることができる階層ファイル構造が導入されます。

ヒント

分析のユースケースがある場合は、Azure Data Lake Storage と Premium ブロック BLOB ストレージアカウントを使用することを強くお勧めします。

このセクションには、次の例が含まれています。

Premium ブロック BLOB ストレージアカウント

高速データハイドレーション

Premium ブロック BLOB ストレージは、環境を迅速にハイドレートつまり立ち上げるのに役立ちます。バンキングなどの業界では、特定の規制要件により、企業は環境を定期的に解体し、最初から回復させる必要がある場合があります。環境をハイドレートするために使用されるデータは、迅速に読み込まれる必要があります。

一部のパートナーは、毎週 MongoDB インスタンスのコピーを Premium ブロック BLOB ストレージアカウントに格納しています。その後、システムは解体されます。システムをもう一度速やかにオンラインに戻すために、MongoDB インスタンスの最新のコピーが読み取られ、読み込まれます。監査のために、以前のコピーは一定期間クラウドストレージに保持されます。

対話型編集アプリケーション

複数のユーザーが同じコンテンツを編集するアプリケーションでは、スムーズなユーザーエクスペリエンスのために更新の速度が重要になります。

一部のパートナーは、ビデオ編集ソフトウェアを開発しています。ユーザーがビデオに行ったすべての更新は、他のユーザーにすぐに表示されます。ユーザーは、コンテンツの更新が表示されるまで待つことなく、自分のタスクに集中できます。 Premium ブロック BLOB ストレージに関連する低待機時間は、このシームレスなコラボレーションエクスペリエンスの作成に役立ちます。

データ視覚化ソフトウェア

レンダリング時間が短い場合、データ視覚化ソフトウェアで、ユーザーの生産性がはるかに向上する可能性があります。

地図作製業界の企業では、地図作製エディターを使用して地図の問題を検出しています。これらのエディターでは、顧客の Global Positioning System (GPS) データから生成されたデータが使われます。地図の重複を作成するために、編集ソフトウェアではキー検索をすばやく実行することで、地図の小さなセクションがレンダリングされます。

あるケースでは、Premium ブロック BLOB ストレージを使用する前に、パートナーは Standard 汎用 v2 ストレージによってサポートされる HBase クラスターを使用していました。ただし、常時大規模なクラスターを実行し続けるためのコストが上昇してきました。このパートナーは、このアーキテクチャから移行し、代わりに高速のキー検索のために Premium ブロック BLOB ストレージを使用することを決定しました。重複を作成するために、REST API を使用して GPS 座標に対応するタイルをレンダリングしました。 Premium ブロック BLOB ストレージアカウントにより、コスト効率の高いソリューションが提供され、待機時間がはるかに予測可能になりました。

eコマース企業

eコマース企業は、顧客向けストアのサポートに加えて、データウェアハウスと分析ソリューションを内部チームに提供する場合もあります。 Premium ブロック BLOB ストレージアカウントを使用して、これらのデータウェアハウスおよび分析ソリューションによって待機時間の短縮要件をサポートしているパートナーを見てきました。あるケースでは、カタログチームが、オファー、価格、出荷方法、サプライヤー、在庫、物流に関連するデータのデータウェアハウスアプリケーションを管理しています。情報は、多数のユースケース用にクエリ、スキャン、抽出、およびマイニングされます。チームは、このデータに対する分析を実行して、さまざまなマーチャンダイジングチームに関連分析情報や情報を提供します。

対話型分析

ほぼすべての業界で、企業はデータのクエリと分析を対話形式で行う必要があります。

データサイエンティスト、アナリスト、開発者は、Premium ブロック BLOB ストレージアカウントに格納されているデータに対してクエリを実行することで、時間的制約のある分析情報をより迅速に抽出できます。エグゼクティブは、ダッシュボードに表示されるデータが Standard 汎用 v2 アカウントではなく Premium ブロック BLOB ストレージアカウントから取得される場合に、はるかに迅速にダッシュボードを読み込むことができます。

1 つのシナリオでは、アナリストは、何百万ものデバイスからのテレメトリデータをすばやく分析して、製品の使い方をよりよく理解し、製品リリースの決定を行う必要がありました。データを SQL データベースに格納することは、コストがかかります。コストを削減し、クエリ可能なセキュリティを向上するために、Azure Data Lake Storage 対応の Premium ブロック BLOB ストレージアカウントを使用し、Presto と Spark で計算を実行して Hive テーブルから分析情報を生成しました。このように、めったにアクセスされないデータでも、頻繁にアクセスされるデータが持つ計算能力とすべて同じ計算能力を持ちます。

SQL の秒未満のパフォーマンスと Presto の外部ストレージへの 1 秒あたりの入出力操作数 (IOP) の間のギャップを埋めるには、特に小さな Optimized Row Columnar (ORC) ファイルを処理する場合に、一貫性とスピードが重要です。 Data Lake Storage と一緒に使用する場合の Premium ブロック BLOB ストレージアカウントは、このシナリオで、Standard 汎用 v2 アカウントの 3 倍のパフォーマンスの向上が繰り返し実証されています。クエリは、コンピューティングマシンにローカルと感じるほど高速に実行されました。

別のケースでは、パートナーは、セキュリティソリューションから生成されたログを格納してクエリを実行しています。ログは Databricks を使用して生成され、次に Data Lake Storage 対応 Premium ブロック BLOB ストレージアカウントに格納されます。エンドユーザーは、Azure Data Explorer を使用して、このデータに対してクエリを実行して検索しています。この種類のアカウントを選択することで、安定性を高め、対話型クエリのパフォーマンスを向上させています。さらに、ライフサイクル管理 Delete Action ポリシーを数日に設定しており、これはコストを削減するのに役立ちます。このポリシーにより、データが永久に保持されることを防ぎます。代わりに、データは不要になると削除されます。

データ処理パイプライン

ほぼすべての業界で、企業はデータを処理する必要があります。複数のソースからの生データは、ユーザーの意思決定に役立つデータダッシュボードなどのツールでのダウンストリームの使用に役立つように、クレンジングして処理する必要があります。

データを処理する場合に、処理速度が常にトップの懸念事項になるとは限りませんが、一部の業界ではそれが必要です。たとえば、金融サービス業界の企業は、多くの場合、可能な限り確実かつ最も迅速な方法でデータを処理する必要があります。不正を検出するために、それらの企業はさまざまなソースからの入力を処理し、顧客に対するリスクを特定し、すばやいアクションを起こす必要があります。

場合によっては、パートナーが複数の Standard Storage アカウントを使用してさまざまなソースのデータを格納していることがわかりました。さらに、このデータの一部が Data Lake Storage 対応 Premium ブロック BLOB ストレージアカウントに移動され、そこでデータ処理アプリケーションによって新しく到着するデータが頻繁に読み取られます。このアカウントのディレクトリ一覧の呼び出しは、そうでなければ Standard 汎用 v2 アカウントで実行する場合よりもはるかに高速で、はるかに一貫して実行されました。アカウントによって提供される速度と一貫性により、新しいデータが常にダウンストリーム処理システムで迅速に使用できるようになりました。これは、潜在的なセキュリティリスクを迅速にキャッチして対応するのに役立ちました。

モノのインターネット(IoT)

IoT は、日常生活の重要な部分になっています。 IoT は、車の動きを追跡し、照明を制御し、健康を監視するために使用されます。また、産業用アプリケーションもあります。たとえば、企業は IoT を使用して、スマートファクトリプロジェクトを可能にし、農業生産を改善し、石油掘削装置で予知保全のために使用します。 Premium ブロック BLOB ストレージアカウントによって、これらのシナリオに大きな価値が加わります。

鉱業のパートナーがいます。 Data Lake Storage を使用して、HDInsight (Hbase) と共に Premium ブロック BLOB ストレージアカウントを有効にして、きわめて負荷の大きい負荷プロファイルで、複数の採掘装置の種類から時系列センサーデータを取り込んでいます。 Premium ブロック BLOB ストレージは、高いサンプルレートのインジェストに対するニーズを満たすのに役立ちました。さらに、Premium ブロック BLOB ストレージは大量の書き込みトランザクションを実行するワークロード用にコスト最適化されていますが、このワークロードでは (1 秒あたり数万単位で) 多数の小さな書き込みトランザクションが生成されるため、コスト効率にも優れています。

Machine Learning

多くの場合、機械学習モデルをトレーニングするには、大量のデータを処理する必要があります。この処理を完了するために、コンピューティングマシンを長時間実行する必要があります。ストレージコストと比較して、コンピューティングコストは通常、請求額のはるかに大きな割合を占めるので、コンピューティングマシンの実行時間の短縮によって、大幅な節約につながる可能性があります。 Premium ブロック BLOB ストレージを使用して得られる待機時間の短縮によって、この時間と請求額を大幅に削減できます。

Spark クラスターにデータ処理パイプラインをデプロイして、機械学習のトレーニングと推論を実行しているパートナーがいます。 Spark テーブル (parquet ファイル) とチェックポイントを Premium ブロック BLOB ストレージアカウントに格納しています。 Spark チェックポイントによって、多数の入れ子になったファイルやフォルダーを作成できます。それらのディレクトリリスティング操作は、待機時間の短い Premium ブロック BLOB ストレージアカウントと、Data Lake Storage で使用できる階層データ構造を組み合わせたため、高速です。

また、IoT と機械学習が交差するユースケースがある半導体業界のパートナーもいます。製造工場のマシンに接続されている IoT デバイスは、半導体のウェハーの画像を取得し、それらをアカウントに送信します。システムでは、ディープラーニング推論を使用して、プロダクションに問題がある場合や、アクションを実行する必要がある場合に、オンプレミスのマシンに通知できます。画像を迅速かつ確実に読み込み、処理する必要があります。 Data Lake Storage 対応 Premium ブロック BLOB ストレージアカウントを使用すると、これを可能にするのに役立ちます。

リアルタイムストリーミング分析

対話型分析をほぼリアルタイムでサポートするには、システムで大量のデータを取り込んで処理し、そのデータをダウンストリームシステムで使用できるようにする必要があります。 Data Lake Storage 対応 Premium ブロック BLOB ストレージアカウントを使用することは、こうした種類のシナリオに最適です。

メディアやエンターテイメント業界の企業は、イベントを放送する際に、短時間で大量のログとテレメトリデータを生成できます。一部のパートナーは、ストリーミングのために複数のコンテンツ配信ネットワーク (CDN) パートナーに依存しています。どの CDN パートナーにトラフィックを割り当てるかについて、ほぼリアルタイムで決断を下す必要があります。そのため、データの取り込み後、数秒でクエリを実行するためにデータを使用できるようにする必要があります。この迅速な意思決定を促進するために、Premium ブロック BLOB ストレージ内の格納データを使用し、そのデータを Azure Data Explorer (ADX) で処理します。ストレージにアップロードされるテレメトリはすべて ADX で変換されるため、オペレーターやエグゼクティブがすばやく確実にクエリを実行できる使い慣れた形式で格納できます。

データは、複数の Premium パフォーマンス BLOB Storage アカウントにアップロードされます。各アカウントは、Event Grid およびイベントハブに接続されます。 ADX では Blob Storage からデータが取得され、データを正規化するために必要な変換が実行されます (zip ファイルの圧縮解除や JSON から CSV への変換など)。その後、ADX と、Grafana に表示されるダッシュボードを通じて、データをクエリに使用できるようになります。 Grafana ダッシュボードは、オペレーター、エグゼクティブ、その他のユーザーによって使用されます。お客様は元のログを Premium パフォーマンスストレージに保持するか、汎用 v2 ストレージアカウントにコピーします。そこで、それらを長期間の保持と将来の分析のためにホットアクセス層またはクールアクセス層に格納できます。

Premium の概要

まず、お気に入りの BLOB ストレージ機能が Premium ブロック BLOB ストレージアカウントと互換性があることを確認してから、アカウントを作成します。

Note

既存の Standard 汎用 v2 ストレージアカウントを Premium ブロック BLOB ストレージアカウントに変換することはできません。 Premium ブロック BLOB ストレージアカウントに移行するには、Premium ブロック BLOB ストレージアカウントを作成し、データを新しいアカウントに移行する必要があります。

Blob ストレージ機能の互換性を確認する

一部の BLOB ストレージ機能はまだサポートされていないか、Premium ブロック BLOB ストレージアカウントでは部分的にしかサポートされていません。 Premium を選択する前に、「Azure ストレージアカウントにおける Blob Storage 機能のサポート」という記事を確認し、使用する予定の機能がお使いのアカウントで完全にサポートされているかどうかを判断してください。機能のサポートは常に拡張されているため、この記事の更新について定期的に確認してください。

新しいストレージアカウントを作成する

Premium ブロック BLOB ストレージアカウントを作成するには、アカウントを作成するときに、[Premium] パフォーマンスのオプションと [ブロック BLOB] アカウントの種類を選択してください。

BlockBlobStorage アカウントの作成

Note

ストレージアカウントを分析に使用する場合は、Premium ブロック BLOB ストレージアカウントと共に Azure Data Lake Storage を使用することを強くお勧めします。 Azure Data Lake Storage の機能をロック解除するには、[ストレージアカウントの作成] ページの [詳細設定] タブで [階層型名前空間] 設定を有効にします。

次の図は、 [ストレージアカウントの作成] ページのこの設定を示しています。

階層型名前空間の設定

詳細なガイダンスについては、「ストレージアカウントを作成する」を参照してください。

次の方法で共有

Premium ブロック BLOB ストレージアカウント

ハイパフォーマンスワークロード

コスト効率

Premium シナリオ

高速データハイドレーション

対話型編集アプリケーション

データ視覚化ソフトウェア

eコマース企業

対話型分析

データ処理パイプライン

モノのインターネット(IoT)

Machine Learning

リアルタイムストリーミング分析

Premium の概要

Blob ストレージ機能の互換性を確認する

新しいストレージアカウントを作成する

関連項目

フィードバック

その他のリソース

次の方法で共有

Premium ブロック BLOB ストレージ アカウント

ハイ パフォーマンス ワークロード

コスト効率

Premium シナリオ

高速データ ハイドレーション

対話型編集アプリケーション

データ視覚化ソフトウェア

eコマース企業

対話型分析

データ処理パイプライン

モノのインターネット(IoT)

Machine Learning

リアルタイム ストリーミング分析

Premium の概要

Blob ストレージ機能の互換性を確認する

新しいストレージ アカウントを作成する

関連項目

フィードバック

その他のリソース

Premium ブロック BLOB ストレージアカウント

ハイパフォーマンスワークロード

高速データハイドレーション

リアルタイムストリーミング分析

新しいストレージアカウントを作成する