Microsoft Purview データ カタログについて説明する
Microsoft Purview データ カタログの目的は、データ ガバナンスのプラットフォームを提供し、組織のビジネス価値の創造を促進することです。 これを実現するため、データ ガバナンスの原則に沿った豊富な機能セットが用意されています。 この後のセクションでは、Microsoft Purview データ カタログの主な機能の一部について説明します。
ガバナンス ドメイン
ガバナンス ドメイン:ガバナンス ドメインは、マーケティングや財務などのビジネス概念を通じてデータ資産を整理し、データ資産のコンテキストを提供する新しい方法です。 ガバナンス ドメインは、共通のガバナンス、所有権、および用語集の用語、OKR、重要なデータなどのデータ製品とビジネスの概念の検出を可能にする境界です。 次のようなさまざまな種類の境界を確立できます。
- 基本的なビジネス領域 - 人事、営業、財務、サプライ チェーンなど
- 包括的な対象領域 - 製品、関係者など
- 組織の機能に基づく境界 - カスタマー エクスペリエンス、クラウド サプライ チェーン、ビジネス インテリジェンスなど
ビジネス ドメインは、データ カタログの機能として組み込まれている他のいくつかのビジネス概念につながっています。
データ製品
ビジネス ドメインに関連しているのはデータ製品です。 データ製品は、名前、説明、所有者、および (最も重要な) 関連するデータ資産の一覧を持つビジネス コンストラクトです。 データ製品は、その中に含まれる資産のコンテキストを提供し、データ コンシューマーのユース ケースを提供します。
ガバナンス ドメインには多数のデータ製品を収容できますが、データ製品は単一のガバナンス ドメインによって管理され、多くのドメイン間で検出できます。
うまくいっているデータ製品では、データ コンシューマーは日常の言語を使用して貴重なデータを簡単に認識でき、同時にそれらのデータ資産の所有権の責任も合理化されます。
次のような例を考えてみましょう。ここでは、データ サイエンティストが、データ モデルで、および他者から、使用される一連のデータ資産を作成しています。 データ サイエンティストは、データ カタログを使用して、関連するすべてのデータ資産に用語集の用語を追加し、各資産に説明を追加して、類似の情報を検索する際に関連性を高めることができます。しかしながら、データ コンシューマーが用語集のどのような用語を使用すればよいかがわかるか、また、データ コンシューマーがすべてのデータ資産を見つけることができるか、といったことを保証するものではありません。 このような点においては、データ製品がうまく適合します。 データ サイエンティストは、データ モデルの作成に使用されるすべての資産を一覧表示するデータ製品を作成します。 この説明では、データをどのように使用するかについての例や提案を含む、完全なユース ケースが示されます。 データ サイエンティストは、今やデータ製品の所有者であり、この 1 つのデータ製品で必要なものをすべて入手できるように支援することで、データ コンシューマーの検索エクスペリエンスを向上させてきました。
用語集の用語
用語集の用語は、データ資産に重要なビジネス コンテキストを提供し、データの管理方法、ガバナンス、使用できるよう検出可能にする方法を決定するポリシーも適用します。
用語集の用語は、組織で使用されるビジネス、プロセス、システムを定義する個々の概念です。 これらは、ユーザーにビジネス コンテキストを提供するデータ資産とデータ製品に関連するデータ資産全体に適用できます。
用語は、組織の各部分に固有のコンテキストを作成するよう、ガバナンス ドメインの下に作成されます。 たとえば、営業とマーケティングの両方で使用している同じ用語が異なる意味を持つ場合があり、ガバナンス ドメインはチームがそれらの意味を区別するのに役立ちます。 用語は、作成されると、データ製品にマップされ、それらのデータ製品のコンテキストを提供し、ビジネス コンテキストに基づいた特定のデータ ガバナンスを提供します。
用語集の用語には、ポリシーが含まれるようになったことで、ビジネス コンテキストに基づくデータ ガバナンスが提供されます。 ビジネス用語のポリシーは、特定のビジネス正常性目標、データ ガバナンス要件、使用条件を、用語が適用されるすべてのデータ製品に適用されます。
重要なデータ要素
すべてのデータ要素が同じ重要度や秘密度であるわけではありません。また、すべてのデータの品質を無差別に管理するためのリソースを割り当てることは実用的ではなく、コストがかかる可能性があります。 重要なデータ要素 (CDE) は、データ資産全体にわたる重要な情報の論理的なグループ化です。 これらのグループ化により、データの理解が容易になり、標準化が促進されます。 データ品質規則とアクセス ポリシーをこれらの要素にアタッチして、データ資産全体の機密情報をさらにセキュリティで保護することができます。
次に例を示します。"Customer ID" という重要なデータ要素を、あるテーブルの "CustID"、別のテーブルの "CID" と同じ論理コンテナーにマップすることができます。 ユーザーはデータ資産間でこの値を照合してつながりを付けることができます。また、データ プロデューサーが新しい資産を作成するときに、この要素をブループリントとして使用して、正しい形式で品質情報を提供できます。
重要なデータ要素はガバナンス ドメイン内に作成され、これらの重要な情報を管理するためのポリシーを設定できます。
CDE を作成することで、組織はリソースを戦略的に割り当て、ビジネスに最も大きな影響を与える領域にガバナンスの取り組みの重点を置くことができます。
OKR
Microsoft Purview の OKR (目標と主要な結果) は、ガバナンス ドメインとデータ製品に関連付けられた追跡可能なビジネス目標であり、ビジネス データの価値を強調するものです。
OKR は、データ製品を実際のビジネス目標に直接リンクして、ビジネスとデータ資産の間にあるギャップを越えます。 データ ガバナンスは、単なる IT タスクやエンジニアリングのベスト プラクティスではなく、価値の生成の重要な部分です。
データ アクセス ポリシー
データ カタログ アクセス ポリシーを使用すると、データ製品へのアクセスを管理し、それを必要とするユーザーにアクセスを提供するシステムを設定できます。 セルフサービス アクセスの機会を作成しつつ、セキュリティと適切な使用基準を維持することで、データ資産のイノベーションと柔軟性を促進します。
検索と参照
必要なデータについて、どこを検索すればよいかがわからないため、データの検出に時間がかかる場合があります。 検索を使用すると、データ コンシューマーは分析やガバナンス ワークロードに必要なデータを簡単に見つけることができます。 検索は、探しているものがわかっている場合には問題ありませんが、データ コンシューマーが使用可能なデータを探索する必要がある場合があります。 Microsoft Purview データ カタログは、コレクションから使用できるデータ、またはカタログ内の各データ ソースの階層をたどることで、使用可能なデータを探索できる参照エクスペリエンスを提供します。
正常性管理
正常性管理には、データ ガバナンス戦略と管理を強化するための機能があります。
正常性コントロール:データ正常性コントロールを使用すると、チームは、ガバナンスの正常性を監視し、提供された正常性コントロールを使用して進行状況を追跡することで、データ ガバナンスを完遂するための過程を分析して追跡できます。 データ正常性コントロールは、組織のデータの品質、セキュリティ、および全体的な正常性を監視、維持、改善するために実装される特定の手段、プロセス、ツールです。
データ正常性コントロールの利点には次のものがあります。
- データ品質の向上:データが正確で一貫性があり、意思決定のための信頼性が維持されるようにします。
- セキュリティの強化:機密データを、侵害、不正アクセス、破損から保護します。
- 規制コンプライアンス:組織がデータ管理の法的標準と業界標準に準拠するのに役立ちます。
- 業務効率:データの問題の修正に費やされる時間とリソースを削減し、データがすぐに入手可能で、使用できるようにします。
- リスク軽減:データ管理が不十分な場合に発生する可能性のある、コストのかかるエラーやデータ関連のリスクを防ぎます。
要約すると、データ正常性コントロールは、包括的なデータ ガバナンス戦略の不可欠なコンポーネントであり、組織がデータ資産の整合性、セキュリティ、使いやすさを維持するのに役立ちます。
正常性アクション:正常性管理アクションを使用することで、ユーザーは、データ資産全体のデータの正常性とガバナンスを向上させるための手順を得ることができます。 これらのアクションは、データ製品のデータ ガバナンス正常性コントロール スコアを計算するために行われるチェックに対応しています。 これらのアクションに対処することで、正常性スコアが上がり、全体的に使いやすく、検出可能なデータ カタログが促進されます。
データ品質
Microsoft Purview データ品質は、ガバナンス ドメインとデータ所有者がデータ エコシステムの品質を評価して監視できるようにする包括的なソリューションであり、改善の対象となるアクションを促進します。
Data Quality は、すぐに使用できる (OOB) ルールや AI で生成されたルールなど、ノーコード/ローコードのルールを使用してデータ品質を評価する機能をユーザーに提供します。 これらのルールは、データ資産、データ製品、ガバナンス ドメインのレベルでスコアを提供するために集計され、各ドメイン内のデータ品質のエンドツーエンドの可視性が保証されます。 Microsoft Purview データ品質には、AI を利用したデータ プロファイリング機能も組み込まれています
Microsoft Purview データ品質を適用することで、組織はデータ資産の品質を効果的に測定し、監視し、強化できます。