クール アクセスを使用する Azure NetApp Files ストレージ
Azure NetApp Files ストレージとクール アクセスを使うと、非アクティブなデータが Azure NetApp Files ストレージ ("ホット層") から Azure ストレージ アカウント ("クール層") に移動するように構成できます。 クール アクセスを有効にすると、非アクティブなデータ ブロックがボリュームとボリュームのスナップショットからクール層に移動され、コストが節約されます。
ほとんどのコールド データは、非構造化データに関連付けられています。 多くのストレージ環境で、合計ストレージ容量の 50% 以上を占めている可能性があります。 生産性向上ソフトウェア、完了したプロジェクト、古いデータセットに関連付けられたアクセス頻度の低いデータは、高パフォーマンス ストレージの非効率的な使用法となります。
Azure NetApp Files は、3 つのサービス レベル (Standard、Premium、Ultra) でクール アクセスをサポートします。
次の図は、クール アクセスが有効なボリュームを持つアプリケーションを示しています。
初期書き込みでは、データ ブロックには "ウォーム" な温度値 (図では赤いデータ ブロック) が割り当てられ、"ホット" 層に存在します。 データがボリューム上に存在する場合、温度スキャンが各ブロックのアクティビティを監視します。 データブロックが非アクティブの場合、冷却期間で指定された日数だけ非アクティブになるまで、温度スキャンはブロックの値を減少させます。 冷却期間は 2 から 183 日の間で設定でき、既定値は 31 日です。 "コールド" とマークされると、階層化スキャンによってブロックが収集され、4 MB のオブジェクトにパッケージ化され、Azure Storage に完全に透過的に移動されます。 アプリケーションとユーザーには、これらのクール ブロックは引き続きオンラインで表示されます。 階層化されたデータはオンラインのように見え、ユーザーとアプリケーションは、クール層からの透過的かつ自動化された取得によってこのデータを引き続き使用できます。
Default
(クール アクセス取得ポリシーが構成されていない場合を除く) では、クール層のデータ ブロックが再びランダムに読み取られた場合は "ウォーム" となり、ホット層に戻されます。 ウォーム とマークされると、データ ブロックは再び温度スキャンの対象になります。 ただし、クール層の非アクティブ データに対する大規模なシーケンシャル読み取り (インデックスやウイルス対策スキャンなど) によってデータが "ウォーム" になることはなく、非アクティブ データをホット層に戻すトリガーにもなりません。
メタデータはクールになることはなく、常にホット層に残ります。 そのため、メタデータを集中的に使用するワークロードのアクティビティ (チップ設計、VCS、ホーム ディレクトリなどのファイル数の多い環境など) は、階層化の影響を受けません。
サポートされているリージョン
Azure NetApp Files ストレージとクール アクセスは、次のリージョンでサポートされています。
- オーストラリア中部
- オーストラリア中部 2
- オーストラリア東部
- オーストラリア南東部
- ブラジル南部
- ブラジル南東部
- カナダ中部
- カナダ東部
- インド中部
- 米国中部
- 東アジア
- 米国東部
- 米国東部 2
- フランス中部
- ドイツ北部
- ドイツ中西部
- イスラエル中部
- イタリア北部
- 東日本
- 西日本
- 韓国中部
- 韓国南部
- 米国中北部
- 北ヨーロッパ
- ノルウェー東部
- ノルウェー西部
- カタール中部
- 南アフリカ北部
- 米国中南部
- インド南部
- 東南アジア
- スイス北部
- スイス西部
- スウェーデン中部
- アラブ首長国連邦中部
- アラブ首長国連邦北部
- 英国南部
- 英国西部
- US Gov アリゾナ
- US Gov テキサス
- US Gov バージニア州
- 西ヨーロッパ
- 米国西部
- 米国西部 2
- 米国西部 3
クール アクセスのデータへの影響
このセクションでは、長期間の大規模なデータセットのウォーミング テストについて説明します。 データの 100% がクール層にあり、時間の経過に伴いウォームになるデータセットのシナリオ例を示します。
通常、ランダムにアクセスされるデータは、作業セット (読み取り、変更、書き込み) の一部として開始されます。 データは関連性を失うと "クール" になり、最終的にクール層に階層化されます。
クール データが再びホットになる場合があります。 作業セット全体がコールドとして開始されるのは一般的ではありませんが、監査、年末処理、四半期末処理、訴訟、年末ライセンス レビューなどのいくつかのシナリオは存在します。
このシナリオでは、100% がクールであるデータセットのウォーミング パフォーマンス動作に関する分析情報を提供します。 この分析情報は、それが一部であるか、データセット全体であるかに関係なく、当てはまります。
4K ランダム読み取りテスト
このセクションでは、合計 10 TB のデータを含む 160 ファイルにわたる 4K ランダム読み取りテストについて説明します。
設定
容量プール サイズ: 100 TB の容量プール
ボリュームの割り当て容量: 100 TB のボリューム
作業データセット: 10 TB
サービス レベル: クール アクセスを使用する Standard Storage
ボリューム数/サイズ: 1
クライアント数: 4 つの標準 8-s クライアント
OS: RHEL 8.3
マウント オプション: rw,nconnect=8,hard,rsize=262144,wsize=262144,vers=3,tcp,bg,hard
方法
このテストは、合計 10 TB のデータを含む 160 個のファイルに対して 4K ランダム読み取りテストを実行するように FIO を介して設定されました。 FIO は、作業データセット全体で各ブロックをランダムに読み取るように構成されました。 (各ブロックに 1 回アクセスする代わりに、テストの一部として任意のブロックを何度でも読み取ることができます)。 このスクリプトは 5 分に 1 回呼び出され、パフォーマンスに関するデータ ポイントが収集されました。 ブロックはランダムに読み取られると、ホット層に移動されます。
このテストは、大規模なデータセットを使用し、最も悪い状態の最も古いデータ (すべてのキャッシュがダンプされたデータ) から開始して数日間実行されました。 再ウォームにかかる合計時間はデータセットのサイズによって異なるため、X 軸の時間コンポーネントは削除されました。 この曲線は、データセットに応じて、日、時間、分、さらには秒単位になる場合があります。
結果
次のグラフは、100% がクールで、バッファーがクリアされた 10 TB の作業データセット (絶対的に最も悪い状態の古いデータ) で 2.5 日間にわたって実行されたテストを示しています。
64K シーケンシャル読み取りテスト
設定
容量プール サイズ: 100 TB の容量プール
ボリュームの割り当て容量: 100 TB のボリューム
作業データセット: 10 TB
サービス レベル: クール アクセスを使用する Standard Storage
ボリューム数/サイズ: 1
クライアント数: 1 つの大規模なクライアント
OS: RHEL 8.3
マウント オプション: rw,nconnect=8,hard,rsize=262144,wsize=262144,vers=3,tcp,bg,hard
方法
シーケンシャルな読み取りブロックは、ホット層に再ウォームされません。 ただし、データセットのサイズが小さいと、キャッシュによりパフォーマンスが向上する可能性があります (パフォーマンスの変化は保証されません)。
このテストでは、次のデータ ポイントが提供されます。
- 100% ホット層のデータセット
- 100% クール層のデータセット
このテストは、安定したパフォーマンス数値を取得するために 30 分間実行されました。
結果
次の表は、テスト結果をまとめたものです。
64-K シーケンシャル | 読み取りスループット |
---|---|
ホット データ | 1,683 MB/秒 |
クール データ | 899 MB/秒 |
テストの結論
クール層から読み取られたデータは、パフォーマンスが低下しています。 クールにする時間を正しく設定すると、パフォーマンスの低下がまったく発生しない可能性があります。 クール層アクセスがほとんどない場合があるので、30 日の期間がウォーム データをウォーム状態に保つのに最適です。
ホット層とクール層の間でブロックが入れ替わる状況を回避する必要があります。 たとえば、データのワークロードをクール 7 日に設定し、データセットの大部分を 11 日ごとにランダムに読み取ります。
要約すると、作業セットが予測可能な場合は、アクセス頻度の低いデータ ブロックをクール層に移動することでコストを節約できます。 クールになる前の 7 - 30 日間の待機範囲では、休止状態になった後にほとんどアクセスされない作業セットや、アクセス時にホット層の速度を必要としない作業セットに対し、大きな時間枠が提供されます。
メトリック
クール アクセスにはパフォーマンス メトリックがあり、ボリュームごとに次の使用パターンを把握できます。
- ボリューム クール層のサイズ
- ボリューム クール層のデータ読み取りサイズ
- ボリューム クール層のデータ書き込みサイズ
請求
新しく作成される容量プールのボリューム レベルで、階層化を有効にできます。 課金方法は、次の要因に基づきます。
- 容量とサービス レベル
- 容量プール内の未割り当て容量
- クール層の容量
- BLOB ストレージ上のトランザクション コスト (
GET
およびPUT
要求) に加えてマークアップによって決定されるレートでのホット層とクール層間のネットワーク転送、およびホット層間のいずれかの方向のプライベート リンク転送。
容量プールの課金計算は、クール層に階層化されていないデータについてはホット層のレートで行われます。これには、容量プール内の未割り当ての容量が含まれます。 ボリュームの階層化を有効にすると、クール層の容量はクール層のレートになり、残りの容量はホット層のレートになります。 クール層のレートは、ホット層のレートよりも低くなります。
課金構造の例
4 TiB Standard 容量プールを作成したとします。 この課金構造は、4 TiB 全体の Standard 容量レベルのレートです。
容量プールにボリュームを作成してクール層へのデータの階層化を開始する際の、該当する課金構造について次のシナリオで説明します。
それぞれ 1 TiB のボリュームを 3 つ作成するとします。 ボリューム レベルで階層化を有効にすることはできません。 課金計算は次のとおりです。
- ホット層レートで 3 TiBの割り当て容量
- ホット層レートで 1 TiBの未割り当て容量
- クール層レートの容量はゼロ
- BLOB ストレージ上のトランザクション コスト (
GET
、PUT
) に加えてマークアップによって決定されるレートでのホット層とクール層間のネットワーク転送、およびホット層間のいずれかの方向のプライベート リンク転送はゼロ。
それぞれ 1 TiB のボリュームを 4 つ作成するとします。 各ボリュームは、ホット層のボリューム容量が 0.25 TiB、クール層のボリューム容量が 0.75 TiB です。 課金計算は次のとおりです。
- ホット層レートの容量は 1 TiB
- クール層レートの容量は 3 TiB
- BLOB ストレージ上のトランザクション コスト (
GET
、PUT
) に加えてマークアップによって決定されるレートでのホット層とクール層間のネットワーク転送、およびホット層間のいずれかの方向のプライベート リンク転送。
それぞれ 1 TiB のボリュームを 2 つ作成するとします。 各ボリュームは、ホット層のボリューム容量が 0.25 TiB、クール層のボリューム容量が 0.75 TiB です。 課金計算は次のとおりです。
- ホット層レートの容量は 0.5 TiB
- ホット層レートで 2 TiBの未割り当て容量
- クール層レートの容量は 1.5 TiB
- BLOB ストレージ上のトランザクション コスト (
GET
、PUT
) に加えてマークアップによって決定されるレートでのホット層とクール層間のネットワーク転送、およびホット層間のいずれかの方向のプライベート リンク転送。
1 TiB のボリュームを 1 つ作成するとします。 ボリュームは、ホット層のボリューム容量が 0.25 TiB、クール層のボリューム容量が 0.75 TiB です。 課金計算は次のとおりです。
- ホット層レートで 0.25 TiBの容量
- クール層レートの容量は 0.75 TiB
- BLOB ストレージ上のトランザクション コスト (
GET
、PUT
) に加えてマークアップによって決定されるレートでのホット層とクール層間のネットワーク転送、およびホット層間のいずれかの方向のプライベート リンク転送。
さまざまなクール期間のコスト計算例
このセクションでは、クール期間が異なるストレージとネットワーク転送のコストの例を示します。
これらの例では、次のことを想定しています。
- ホット層のストレージ コストは $0.000202/GiB/時間です。 クール層のストレージ コストは $0.000082/GiB/時間です。
- ネットワーク転送コスト (クール層からの読み取りまたは書き込みアクティビティを含む) は $0.020000/GiB です。
- クール アクセスが有効な 5 TiB 容量のプールがあります。
- 容量プール内に 1 TiB の未割り当て容量
- クール アクセス用に 4 TiB ボリュームが有効になっています。
- 4 TiB のうち 3 TiB は、クール期間後にクール層に移動されます。
- 毎月、データの 20% がクール層から読み書きされます。
- 各月は 30 日または 730 時間です。 そのため、1 日は 730/30 時間です。
重要
- これらの計算は参考見積もりとしてのみ使用する必要があり、請求金額の正確さの検証には使用しないでください。
- この例で考慮されているレートはサンプルのリージョンのものであり、デプロイの対象となるリージョンによっては異なる場合があります。
- データがクール層から読み取られたり、クール層に書き込まれたりすると、ホット層とクール層のデータ分散の割合が変化します。 この記事の計算は、データの 20% がクール層との間で移動された後ではなく、ホット層とクール層の初期パーセンテージ分布を示しています。
Note
次の例では、容量プールに 1TiB の未割り当て領域が含まれており、クール アクセスが有効な場合に未割り当て領域がどのように課金されるかを示しています。 節約を最大化するには、容量プールのサイズを小さくして、未割り当てのプール容量をなくす必要があります。
例 1: クール期間が 7 日に設定されている
最初の月のストレージ コストは次のようになります。
コスト | 説明 | 計算 |
---|---|---|
1 日目から 30 日目 (30 日間) の未割り当てストレージ コスト | 1 TiB の未割り当てストレージ | 1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 |
1 日目から 7 日目 (7 日間) のストレージ コスト | 4 TiB のアクティブ データ (ホット層) | 4 TiB x 1024 x 7 days x 730/30 hrs. x $0.000202/GiB/hr. = $140.93 |
8 日目から 30 日目 (23 日間) のストレージ コスト | 1 TiB のアクティブ データ (ホット層) 3 TiB の非アクティブ データ (クール層) |
1 TiB x 1024 x 23 days x 730/30 hrs. x $0.000202/GiB/hr. = $115.77 3 TiB x 1024 x 23 days x 730/30 hrs. x $0.000082/GiB/hr. = $140.98 |
ネットワーク転送コスト | 非アクティブ データのクール層への移動 クール層のデータの 20% に対する読み取り/書き込み |
3 TiB x 1024 x $0.020000/GiB = $61.44 3 TiB x 1024 x 20% x $0.020000/GiB = $12.29 |
最初の月の合計 | $622.41 |
2 か月目以降の月のストレージ コストは次のようになります。
コスト | 説明 | 計算 |
---|---|---|
30 日間 のストレージ コスト | 1 TiB の未割り当てストレージ 1 TiB のアクティブ データ (ホット層) 3 TiB の非アクティブ データ (クール層) |
1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 3 TiB x 1024 x 30 days x 730/30 hrs. x $0.000082/GiB/hr. = $183.89 |
ネットワーク転送コスト | クール層のデータの 20% に対する読み取り/書き込み | 3 TiB x 1024 x 20% x $0.020000/GiB = $12.29 |
2 か月目以降の月の合計 | $498.18 |
最初の 6 か月間の節約額:
- クール アクセスなしのコスト:
5 TiB x 1024 x $0.000202/GiB/hr. x 730 hrs. x 6 months = $4,529.97
- クール アクセスありのコスト:
First month + Second month + … + Sixth month = $622.41 + (5x $498.18) = $3,113.31
- クール アクセス使用による節約額:
31.27%
最初の12 か月間の節約額:
- クール アクセスなしのコスト:
5 TiB x 1024 x $0.000202/GiB/hr. x 730 hrs. x 12 months = $9,059.94
- クール アクセスありのコスト:
First month + Second month + … + twelfth month = $622.41 + (11 x $498.18) = $6,102.39
- クール アクセス使用による節約額:
32.64%
例 2: クール期間が 35 日に設定されている
5 TiB はすべて、最初の 1 か月はアクティブ データ (ホット層) です。 最初の月のストレージ コストは次のようになります: 5 TiB x 1024 x 730hr. x $0.000202/GiB/hr. = $755.00
2 か月目のストレージ コストは次のようになります。
コスト | 説明 | 計算 |
---|---|---|
1 日目から 30 日目 (30 日間) の未割り当てストレージ コスト | 1 TiB の未割り当てストレージ | 1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 |
1 日目から 5 日目 (5 日間) のストレージ コスト | 4 TiB のアクティブ データ (ホット層) | 4 TiB x 1024 x 5 days x 730/30 hrs. x $0.000202/GiB/hr. = $100.67 |
6 日目から 30 日目 (25 日間) のストレージ コスト | 1 TiB のアクティブ データ (ホット層) 3 TiB の非アクティブ データ (クール層) |
1 TiB x 1024 x 25 days x 730/30 hrs. x $0.000202/GiB/hr. = $125.83 3 TiB x 1024 x 25 days x 730/30 hrs. x $0.000082/GiB/hr. = $153.24 |
ネットワーク転送コスト | 非アクティブ データのクール層への移動 クール層のデータの 20% に対する読み取り/書き込み |
3 TiB x 1024 x $0.020000 /GiB = $61.44 3 TiB x 1024 x 20% x $0.020000/GiB = $12.29 |
2 か月目の合計 | $604.47 |
3 か月目以降の月のストレージ コストは次のようになります。
コスト | 説明 | 計算 |
---|---|---|
30 日間 のストレージ コスト | 1 TiB の未割り当てストレージ 1 TiB のアクティブ データ (ホット層) 3 TiB の非アクティブ データ (クール層) |
1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 3 TiB x 1024 x 30 days x 730/30 hrs. x $0.000082/GiB/hr. = $183.89 |
ネットワーク転送コスト | クール層のデータの 20% に対する読み取り/書き込み | 3 TiB x 1024 x 20% x $0.020000/GiB = $12.29 |
3 か月目以降の月の合計 | $498.18 |
最初の 6 か月間の節約額:
- クール アクセスなしのコスト:
5 TiB x 1024 x $0.000202/GiB/hr. x 730 hrs. x 6 months = $4,529.97
- クール アクセスありのコスト:
First month + Second month + … + Sixth month = $755.00 + $604.47 + (4 x $498.18) = $3,352.19
- クール アクセス使用による節約額:
25.99%
最初の12 か月間の節約額:
- クール アクセスなしのコスト:
5 TiB x 1024 x $0.000202/GiB/hr. x 730 hrs. x 12 months = $9,059.94
- クール アクセスありのコスト:
First month + Second month + … + twelfth month = $755.00 + $604.47 + (10 x $498.18) = $6,341.27
- クール アクセス使用による節約額:
30.00%
例 3: クール期間が 63 日に設定されている
5 TiB はすべて、最初の 2 か月のアクティブ データ (ホット層) です。 1 か月目および 2 か月目のストレージ コストは次のようになります: 5 TiB x 1024 x 730hr. x $0.000202/GiB/hr. = $755.00
3 か月目のストレージ コストは次のようになります。
コスト | 説明 | 計算 |
---|---|---|
1 日目から 30 日目 (30 日間) の未割り当てストレージ コスト | 1 TiB の未割り当てストレージ | 1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 |
1 日目から 3 日目 (3 日間) のストレージ コスト | 4 TiB のアクティブ データ (ホット層) | 4 TiB x 1024 x 3 days x 730/30 hrs. x $0.000202/GiB/hr. = $60.40 |
4 日目から 30 日目 (27 日間) のストレージ コスト | 1 TiB のアクティブ データ (ホット層) 3 TiB の非アクティブ データ (クール層) |
1 TiB x 1024 x 27 days x 730/30 hrs. x $0.000202/GiB/hr. = $135.90 3 TiB x 1024 x 27 days x 730/30 hrs. x $0.000082/GiB/hr. = $165.50 |
ネットワーク転送コスト | 非アクティブ データのクール層への移動 クール層のデータの 20% に対する読み取り/書き込み |
3 TiB x 1024 x $0.020000/GiB = $61.44 3 TiB x 1024 x 20% x $0.020000/GiB = $12.29 |
3 か月目の合計 | $586.52 |
4 か月目以降の月のストレージ コストは次のようになります。
コスト | 説明 | 計算 |
---|---|---|
30 日間 のストレージ コスト | 1 TiB の未割り当てストレージ 1 TiB のアクティブ データ (ホット層) 3 TiB の非アクティブ データ (クール層) |
1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 1 TiB x 1024 x 30 days x 730/30 hrs. x $0.000202/GiB/hr. = $151.00 3 TiB x 1024 x 30 days x 730/30 hrs. x $0.000082/GiB/hr. = $183.89 |
ネットワーク転送コスト | クール層のデータの 20% に対する読み取り/書き込み | 3 TiB x 1024 x 20% x $0.020000/GiB = $12.29 |
4 か月目以降の月の合計 | $498.18 |
最初の 6 か月間の節約額:
- クール アクセスなしのコスト:
5 TiB x 1024 x $0.000202/GiB/hr. x 730 hrs. x 6 months = $4,529.97
- クール アクセスありのコスト:
First month + Second month + … + Sixth month = (2 x $755.00) + $586.52 + (3 x $498.18) = $3,591.06
- クール アクセス使用による節約額:
20.73%
最初の12 か月間の節約額:
- クール アクセスなしのコスト:
5 TiB x 1024 x $0.000202/GiB/hr. x 730 hrs. x 12 months = $9,059.94
- クール アクセスありのコスト:
First month + Second month + … + twelfth month = (2 x $755.00) + $586.52 + (9 x $498.18) = $6,580.14
- クール アクセス使用による節約額:
27.37%
ヒント
クール アクセスを使用する Azure NetApp Files ストレージのコスト節約予測ツールを使って、変更可能な入力パラメーターに基づいてコスト節約額を対話形式で見積もることができます。