Microsoft Purview 統合カタログのデータ品質レポート
データ品質 (DQ) レポートは、organizationまたはシステム内のデータの品質を評価して要約する包括的なドキュメントです。 通常、さまざまなデータ品質ディメンションの評価とメトリックが含まれており、関係者がデータの正確性、完全性、一貫性、信頼性、タイムラインを理解するのに役立ちます。 このデータ品質レポートを使用すると、チームは正常性管理の進捗状況を一目で追跡し、データ資産のデータ品質を向上させるためにさらに作業が必要な領域を特定できます。
この記事では、このレポートにアクセスする方法と、提供されているデータ品質測定が正常性管理に何を意味するかについて説明します。
レポートの目的
監視とガバナンス: データの品質を継続的に監視および管理し、organizationの標準と規制要件を満たしていることを確認します。
意思決定サポート: 情報に基づいたビジネス上の意思決定を行うために、利害関係者に信頼できるデータを提供します。
問題の特定: データ品質の問題を検出して文書化し、タイムリーな修復を可能にします。
データ管理の改善: データ品質の問題の根本原因を特定し、是正措置を実施することで、データ管理プラクティスを強化します。
パフォーマンス測定: データ品質イニシアチブの有効性を測定し、時間の経過に伴う改善を追跡します。
利害関係者のコミュニケーション: 管理、データ製品の所有者、データ スチュワード、IT チームなど、関係者にデータ品質の状態と進行状況を伝えます。 これらのレポートは、データ品質の状態を明確かつ包括的に表示することで、organization内のデータの整合性と有用性を維持する上で重要な役割を果たします。
前提条件
Data Estate Health 情報を表示するには、データ 正常性閲覧者 のアクセス許可が必要です。
データ ガバナンス正常性レポートを表示する
- Microsoft Purview ポータルを開き、[統合カタログ] を選択します。
- [ 正常性管理 ] ドロップダウンを選択します。
- [レポート] を選択します
- [データ正常性] レポートを選択します。
データ品質ディメンション レポート
レポートの概要ページでは、データ品質ディメンションのスコア、データ品質ルール階層、ディメンション別のデータ品質状態、およびデータ品質ディメンション &、さまざまなデータ資産に使用されるルールの種類について説明します。 上位のコントロールは、全体的な正常性管理をひとめで把握するのに役立ちます。
フィルターを使用して、特定の状態 (下書きなど) にある特定のガバナンス ドメイン、データ製品、またはデータ製品の情報を表示します。
データ品質ディメンション | 説明 |
---|---|
Accuracy | データは、実際のエンティティを正確に表す必要があります。 コンテキストが重要です。 たとえば、顧客アドレスを格納する場合は、実際の場所と一致していることを確認します。 |
完全 | このルールの目的は、空、null、または不足しているデータを識別することです。 この規則は、すべての値が存在することを検証します (必ずしも正しいとは限りません)。 |
適合 | このルールにより、データは日付、住所、許可値の表現などのデータ書式設定標準に従います。 |
一貫性 | このルールは、同じレコードの異なる値が特定のルールに準拠しており、矛盾がないことを確認します。 データの整合性により、同じ情報が異なるレコード間で一様に表現されます。 たとえば、製品カタログがある場合は、一貫性のある製品名と説明が重要です。 |
即時性 | このルールは、データにできるだけ短時間でアクセスできるようにすることを目的としています。 これにより、データが最新の状態になります。 |
独特 | このルールでは、値が重複していないことを確認します。たとえば、顧客ごとに 1 つのレコードしか存在しない場合は、同じ顧客に対して複数のレコードが存在しません。 各顧客、製品、またはトランザクションには、一意の識別子が必要です。 |
データ品質 全体的なスコアとディメンション スコアは、データの実施者とデータ資産所有者が、データの完全性、正確さ、一貫性、信頼性を理解するのに役立ちます。 また、データ資産の品質を向上させるために実行する必要がある改善アクションも示します。
ヒント
フィルターを使用する場合、これらの KPI には、選択したガバナンス ドメインまたはデータ製品のスコアが反映されます。
ディメンション別のデータ品質の状態
データ品質ディメンション スコアは、ガバナンス ドメインごとに計算されます。 ルールにマップされたディメンションとスコアは、データ資産列からデータ資産、データ資産からデータ製品、ガバナンス ドメイン レベルまで、業界標準ディメンションごとにロールアップされます。 ガバナンス ドメインごとにディメンション レベル スコアを除外して、詳細を調査できます。
データ品質ルールの合格率と失敗率
データ製品の DQ ディメンションごとに、データ品質ルールの合格と失敗の比率が測定されています。 このメジャーは、データ所有者とデータの実施者が、データ製品のデータの割合が、不正確、一貫性がない、不完全、重複している、または期待どおりに新鮮ではないかを理解するのに役立ちます。 このメジャーは、適用されたルールが正しくないか、データが正しくないかを調査して理解するのにも役立ちます。
データ品質の詳細レポート
このレポートは、データ製品、データ資産、および重要なデータ要素に適用されるルールの数を把握し、organizationのデータ資産全体の品質を測定および監視するのに役立ちます。 ドリルダウンすると、ルールの種類に対して失敗したデータ資産のレコードの数、パフォーマンスが向上しているルールの種類、信頼できるデータを公開および管理しているガバナンス ドメインとデータ製品を確認できます。 ガバナンス ドメインとデータ製品によってメジャーをフィルター処理して、現在の状態を把握し、改善アクションを計画できます。
注:
- データ品質正常性レポートには、データ正常性コントロールと Purview メタデータセルフサービス分析モデルへの依存関係があります。 お客様がデータ正常性コントロールを使用せず、Purview 統合カタログメタデータをサブスクライブしていない場合、データ品質正常性レポートは更新されません。 お客様は、データ正常性コントロールを使用するか、セルフサービス分析の purview メタデータをサブスクライブしてデータ品質の正常性レポートを更新する必要があります。
- お客様がデータ品質機能を使用していない場合、データ品質の正常性レポートは、データ品質スキャン機能から生成されるデータを使用して作成されるため、空白になります。