次の方法で共有


重要なデータ要素のデータ品質の管理

注:

Microsoft Purview データ カタログは、名前を Microsoft Purview 統合カタログに変更しています。 すべての機能は同じままです。 新しい Microsoft Purview データ ガバナンス エクスペリエンスがリージョンで一般公開されると、名前の変更が表示されます。 リージョン内の名前を確認します

重要なデータ要素 (CDEs) は、データ ソース内のテーブル間で重要な列を論理的にグループ化することで、最も効果の高いガバナンス作業に戦略的に集中できます。

Microsoft Purview データ品質は、重要なデータ要素 (CDE) の品質を測定するための統合ソリューションを提供し、組織は、これらの主要なデータ要素が正確性、完全性、整合性、整合性に必要な標準を満たしていることを確認できます。

組織は、品質を維持するために CDEs が満たす必要がある特定の品質しきい値を確立できます。 これらのしきい値は論理 CDE レベルで適用されますが、CDE を構成するすべての個々の列にトリクルダウンします。 これらのルールには、検証、クレンジング、標準化、エンリッチメントなど、データ品質のさまざまな側面が含まれます。 たとえば、データ品質ルールでは、顧客住所を特定の形式に標準化する必要があるか、従業員 ID が特定のパターンに従う必要があることを指定する場合があります。

データ品質規則が CDEs に適用されると、Microsoft Purview データ品質は基になる物理データ要素を体系的に評価して、これらの規則への準拠を評価します。 Purview Data Quality の統合アプローチを使用することで、組織は重要なデータ要素の品質を事前に監視および管理し、信頼性が高く、正確で、目的に合った状態を維持できます。 これにより、意思決定プロセスが強化されるだけでなく、データ エラーや不整合に関連するリスクを軽減し、最終的にはビジネス成果を向上させることができます。

サポートされている資産の種類

  • Azure Data Lake Storage Gen2
    • ファイルの種類: Delta 形式
  • Azure SQL データベース
  • Microsoft Fabric Lakehouse (デルタ テーブル)

CDEs で使用できるデータ品質ルール

Microsoft Purview データ品質では、IDE に対して以下の規則を構成できます。 ルールを選択すると、詳細については、一般的な データ品質ルールに 関する記事が表示されます。

Rule 定義
一意の値 列の値が一意であることを確認します。
データ型の一致 列の値がデータ型の要件と一致することを確認します。
空/空白フィールド 値が必要な列で空白フィールドと空のフィールドを検索します。

CDEs のデータ品質を構成する

  1. まだ作成していない場合は、 重要なデータ要素 (CDE) を作成し、 列を追加します

  2. 次の方法で CDE を開きます。

    1. データ カタログを開き、[ データ管理 ] ドロップダウンと [ ガバナンス ドメイン ] サブメニューを選択します。
    2. 一覧から ガバナンス ドメイン を選択します。
    3. [ 重要なデータ要素 ] タイルを選択します。
    4. 一覧から重要なデータ要素を選択します。
  3. 重要なデータ要素の [ データ品質 ] タブを選択します。

    重要なデータ要素の新しいデータ品質ルール ページのスクリーンショット。

  4. [新しいルール] を選択して、重要なデータ要素に 新しいルールを追加します。

  5. 使用する データ品質ルールの種類 を選択し、[ 次へ] を選択します。

  6. ルールの種類に必要な詳細を指定します。

  7. ルールを オフ またはオンに切り替えるかどうかを選択 します

  8. [作成] を選択します。

CDEs のデータ品質ルールを実行する

CDE に関連付けられた列を持つ使用可能なデータ資産に対してデータ品質スキャンを実行すると、その CDE に対して構成したデータ品質ルールによってスコアが生成されます。

  1. CDE に関連付けられているデータ資産のデータ品質スキャンをスケジュールまたは実行します。

  2. データ品質スキャン ジョブの実行中の進行状況を監視し、エラーや中断なく完了することを確認します。 履歴スナップショットから正常に実行された適用されたデータ品質ルールを確認します。

    重要なデータ要素ルールを示すデータ品質スキャン結果のスクリーンショット。

  3. スキャン ジョブの結果を確認 して、適用されたルールに基づいて CDE データ資産の品質を評価します。

    重要なデータ要素のスキャン結果のスクリーンショット。

  4. データ品質スキャン ジョブからの結果を分析して、CDE データ資産に関連する問題、異常、または改善領域を特定します。 これには、品質を向上させるためにデータのクレンジング、標準化、または強化が含まれる場合があります。

次の手順