Microsoft Purview データマップの価格

[アーティクル]
08/23/2023

このガイドでは、Microsoft Purview ガバナンスポータルのデータマップの価格ガイドラインについて説明します。

Microsoft Purview (旧称 Azure Purview) の完全な価格ガイドラインの詳細については、価格ガイドラインの概要に関するページを参照してください。

具体的な価格の詳細については、 Microsoft Purview (旧称 Azure Purview) の価格に関するページを参照してください。この記事では、Microsoft Purview データマップの価格に影響を与える機能と要因について説明します。

Microsoft Purview データマップの価格に影響する直接コストは、次の 3 つのディメンションに基づいています。

エラスティックデータマップ
自動スキャン & 分類
高度なリソースセット

エラスティックデータマップ

データマップは Microsoft Purview ガバナンスポータルアーキテクチャの基盤であるため、特定の時点でデータ資産の資産情報を最新の状態にする必要があります
データマップは、 容量ユニット (CU) の観点から課金されます。カタログが最大 10 GB のメタデータストレージを格納し、1 秒に最大 25 のデータマップ操作を提供する場合、データマップは 1 つの CU でプロビジョニングされます
データマップは、アカウントが最初に作成されたときに常に 1 つの CU でプロビジョニングされます
ただし、データマップは、操作スループットとメタデータストレージという 2 つの重要な要因に関するデータマップの変更に対応するために、その弾力性ウィンドウの最小と最大の制限の間で自動的にスケーリングされます

操作スループット

データマップに対して実行された作成、読み取り、更新、削除の操作に基づくイベントドリブンファクター
データマップ操作の例を次に示します。
- Data Map での資産の作成
- 所有者、スチュワード、親、系列などの資産へのリレーションシップの追加
- 資産を編集して、説明、用語集の用語などのビジネスメタデータを追加する
- 検索結果ページに結果を返すキーワード検索
- API を使用した情報のインポートまたはエクスポート
データマップで複数のクエリが実行されている場合、I/O 操作の数も増え、データマップのスケールアップが発生します
同時ユーザーの数は、データマップ容量ユニットを制御する要素も形成します
考慮すべきその他の要因は、検索クエリの種類、API の相互作用、ワークフロー、承認などです。
データバーストレベル
- より多くの操作/秒スループットが必要な場合、データマップは弾力性ウィンドウ内で自動スケーリングして、変更された負荷に対応できます
- これは、推定して計画する必要がある バースト特性 を構成します。
- バースト特性は、 バーストレベル とバーストが存在する バースト期間 で構成されます。
  - バーストレベルは、安定した状態で予想される一貫性のある弾力性の乗算インデックスです
  - バースト期間は、メタデータの増加またはデータマップに対する操作の数が多いため、このようなバースト (弾力性) が予想される月の割合です。

メタデータストレージ

資産の数がデータ資産内で減少し、その後の増分スキャンによってデータマップ内で削除された場合、ストレージコンポーネントは自動的に削減され、データマップのスケールダウンが行われます

自動スキャン、分類、インジェスト

Microsoft Purview データマップへのメタデータの取り込みをトリガーできる 2 つの主要な自動化プロセスがあります。

ネイティブコネクタを使用した自動スキャン。このプロセスには、次の 3 つのメイン手順が含まれます。
- メタデータスキャン
- 自動分類
- Microsoft Purview データマップへのメタデータの取り込み
Azure Data FactoryまたはAzure Synapse パイプラインを使用した自動インジェスト。通常、このプロセスには次のものが含まれます。
- アカウントが任意のAzure Data FactoryまたはAzure Synapseパイプラインに接続されている場合は、Microsoft Purview データマップへのメタデータと系列の取り込み。

ネイティブコネクタを使用した自動スキャン

フルスキャンは、データソースの選択したスコープ内のすべての資産を処理しますが、増分スキャンでは、前回の正常なスキャン以降に作成、変更、または削除された資産が検出され、処理されます。
すべてのスキャン (完全スキャンまたは増分スキャン) は 、更新、変更、または削除された 資産を選択します
異なる部門に属する複数のユーザーまたはグループが同じデータソースのスキャンを設定し、重複スキャンの価格を高めるシナリオを考慮し、回避することが重要です
データ資産の変更に合わせて最初のフルスキャンを実行した後、 頻繁に増分 スキャンをスケジュールします。これにより、データマップが常に最新の状態に保たれ、インクリメンタルスキャンではフルスキャンと比較して v コア時間が短くなります
データソースの [詳細の表示] リンクを使用すると、ユーザーはフルスキャンを実行できます。ただし、スキャンルールセット (分類/ファイルの種類) に変更がある場合を除き、最適化されたスキャンの完全スキャン後に増分スキャンを実行することを検討してください。
親コレクションにデータソースを登録 し、 子コレクションのスコープスキャン をさまざまなアクセス制御で登録して、重複するスキャンコストが発生しないようにします
コレクションの承認を使用して、きめ細かいアクセス制御とデータソース管理者ロールを使用してスキャンするためのデータソースの登録を許可されているユーザーを抑制します。これにより、有効なデータソースのみが登録され、v コア時間のスキャンが制御され、スキャンのコストが削減されます
スキャンするデータソースの種類と資産の数がスキャン期間に影響することを検討してください
スキャナーの最適な使用を確保するために、ビジネス要件に関連するデータ資産と分類で使用可能なファイルの種類のサブセットのみを含むカスタムスキャンルールセットを作成する
データソースの新しいスキャンを作成するときに、実際にスキャンを実行する前に推奨される 準備の順序 に従ってください。これには、 ビジネス固有の分類 と ファイルの種類 (ストレージアカウント) の要件の収集が含まれます。これにより、複数のスキャンを回避するための適切なスキャンルールセットを定義し、要件を満たして複数のスキャンの不要なコストを制御できます
スキャンスケジュールを Self-Hosted Integration Runtime (SHIR) VM (Virtual Machines) サイズに合わせて調整して、仮想マシンに追加コストがリンクされないようにします

Azure Data FactoryパイプラインまたはAzure Synapse パイプラインを使用した自動インジェスト

メタデータと系列は、ソースシステムでパイプラインが実行されるたびに、Azure Data FactoryまたはAzure Synapse パイプラインから取り込まれます。

高度なリソースセット

Microsoft Purview データマップでは、リソースセットを使用して、データレイク内のすべてのファイルをスキャンし、パターン (GUID、ローカライズパターンなど) を見つけてデータマップ内の 1 つの資産としてグループ化する機能を提供することで、多数のデータ資産を 1 つの論理リソースにマッピングするという課題に対処します。
Advanced Resource Set はオプションの機能で、合計サイズ、パーティション数など、計算されたエンリッチされたリソースセット情報を取得し、パターンルールを使用してリソースセットのグループ化をカスタマイズできます。高度なリソースセット機能が有効になっていない場合、統合カタログには引き続きリソースセット資産が含まれますが、集計プロパティは含まれません。この場合、顧客に対して課金される "リソースセット" メーターはありません。
Microsoft Purview データマップの高度なリソースセットを切り替える前に、基本的なリソースセット機能を使用して、要件が満たされているかどうかを確認します
次の場合は、Advanced Resource Sets をオンにすることを検討してください。
- データレイクスキーマは絶えず変化しており、基本的なリソースセット機能を超えて、#partitions、データ資産のサイズなどのパラメーターをMicrosoft Purview データマップがサービスとして計算できるようにするために、より多くの価値を探しています
- リソースセット資産のグループ化方法をカスタマイズする必要があります。
Advanced Resource Sets の課金は、オフライン層がリソースセット情報を集計するために使用するコンピューティングに基づいており、カタログ内のリソースセットのサイズ/数に依存します。

次の方法で共有

Microsoft Purview データマップの価格

エラスティックデータマップ

操作スループット

メタデータストレージ

自動スキャン、分類、インジェスト

ネイティブコネクタを使用した自動スキャン

Azure Data FactoryパイプラインまたはAzure Synapse パイプラインを使用した自動インジェスト

高度なリソースセット

次の手順

フィードバック

その他のリソース

次の方法で共有

Microsoft Purview データ マップの価格

エラスティック データ マップ

操作スループット

メタデータ ストレージ

自動スキャン、分類、インジェスト

ネイティブ コネクタを使用した自動スキャン

Azure Data FactoryパイプラインまたはAzure Synapse パイプラインを使用した自動インジェスト

高度なリソース セット

次の手順

フィードバック

その他のリソース

Microsoft Purview データマップの価格

エラスティックデータマップ

メタデータストレージ

ネイティブコネクタを使用した自動スキャン

高度なリソースセット