重要なデータ要素のデータ品質の管理
注:
Microsoft Purview データ カタログは、名前を Microsoft Purview 統合カタログに変更しています。 すべての機能は同じままです。 新しい Microsoft Purview データ ガバナンス エクスペリエンスがリージョンで一般公開されると、名前の変更が表示されます。 リージョン内の名前を確認します。
重要なデータ要素 (CDEs) は、データ ソース内のテーブル間で重要な列を論理的にグループ化することで、最も効果の高いガバナンス作業に戦略的に集中できます。
Microsoft Purview データ品質は、重要なデータ要素 (CDE) の品質を測定するための統合ソリューションを提供し、組織は、これらの主要なデータ要素が正確性、完全性、整合性、整合性に必要な標準を満たしていることを確認できます。
組織は、品質を維持するために CDEs が満たす必要がある特定の品質しきい値を確立できます。 これらのしきい値は論理 CDE レベルで適用されますが、CDE を構成するすべての個々の列にトリクルダウンします。 これらのルールには、検証、クレンジング、標準化、エンリッチメントなど、データ品質のさまざまな側面が含まれます。 たとえば、データ品質ルールでは、顧客住所を特定の形式に標準化する必要があるか、従業員 ID が特定のパターンに従う必要があることを指定する場合があります。
データ品質規則が CDEs に適用されると、Microsoft Purview データ品質は基になる物理データ要素を体系的に評価して、これらの規則への準拠を評価します。 Purview Data Quality の統合アプローチを使用することで、組織は重要なデータ要素の品質を事前に監視および管理し、信頼性が高く、正確で、目的に合った状態を維持できます。 これにより、意思決定プロセスが強化されるだけでなく、データ エラーや不整合に関連するリスクを軽減し、最終的にはビジネス成果を向上させることができます。
サポートされている資産の種類
- Azure Data Lake Storage Gen2
- ファイルの種類: Delta 形式
- Azure SQL データベース
- Microsoft Fabric Lakehouse (デルタ テーブル)
CDEs で使用できるデータ品質ルール
Microsoft Purview データ品質では、IDE に対して以下の規則を構成できます。 ルールを選択すると、詳細については、一般的な データ品質ルールに 関する記事が表示されます。
Rule | 定義 |
---|---|
一意の値 | 列の値が一意であることを確認します。 |
データ型の一致 | 列の値がデータ型の要件と一致することを確認します。 |
空/空白フィールド | 値が必要な列で空白フィールドと空のフィールドを検索します。 |
CDEs のデータ品質を構成する
次の方法で CDE を開きます。
- データ カタログを開き、[ データ管理 ] ドロップダウンと [ ガバナンス ドメイン ] サブメニューを選択します。
- 一覧から ガバナンス ドメイン を選択します。
- [ 重要なデータ要素 ] タイルを選択します。
- 一覧から重要なデータ要素を選択します。
重要なデータ要素の [ データ品質 ] タブを選択します。
[新しいルール] を選択して、重要なデータ要素に 新しいルールを追加します。
使用する データ品質ルールの種類 を選択し、[ 次へ] を選択します。
ルールの種類に必要な詳細を指定します。
ルールを オフ またはオンに切り替えるかどうかを選択 します。
[作成] を選択します。
CDEs のデータ品質ルールを実行する
CDE に関連付けられた列を持つ使用可能なデータ資産に対してデータ品質スキャンを実行すると、その CDE に対して構成したデータ品質ルールによってスコアが生成されます。
データ品質スキャン ジョブの実行中の進行状況を監視し、エラーや中断なく完了することを確認します。 履歴スナップショットから正常に実行された適用されたデータ品質ルールを確認します。
スキャン ジョブの結果を確認 して、適用されたルールに基づいて CDE データ資産の品質を評価します。
データ品質スキャン ジョブからの結果を分析して、CDE データ資産に関連する問題、異常、または改善領域を特定します。 これには、品質を向上させるためにデータのクレンジング、標準化、または強化が含まれる場合があります。