データ ガバナンスの概要
データ ガバナンスを成功させるための鍵は、構造化データをデータ エンティティとデータ主体領域に分割することです。 そのようにすると、データ ガバナンス ソリューションを使用して、特定のデータ エンティティとデータ主体領域を、個人、プロセス、ポリシー、テクノロジで囲めるようになります。 このソリューションは、データ エンティティのライフサイクルの管理に役立ちます。 データ カタログ内の用語集で一般的なビジネス ボキャブラリを確立することも、データの管理に役立ちます。
データ カタログ テクノロジは重要です。 データの場所や意味がわからない場合、データを管理することはできません。 データ カタログ ソフトウェアは、自動データ検出、データ品質を決定する自動プロファイリング、自動機密データ検出を提供します。 データ カタログ テクノロジは、さまざまなデータをカタログのビジネス用語集にある一般的なボキャブラリ データ名と定義にマップして、そのデータの意味を理解できるようにするのにも役立ちます。
データ分類は、ビジネス コンテキストに基づいて一意の論理ラベルまたはクラスを割り当てることで、データ資産を分類します。 分類ラベルまたはクラスの例を次に示します。
- パスポート番号。
- 運転免許証番号。
- クレジット カードの番号
- SWIFT コード。
- 個人の名前。
データ カタログに、データ機密性の分類体系などのデータ分類体系を定義できます。 体系を定義するには、カタログ内のポリシーとルールをさまざまな分類レベルに関連付けます。
データ ライフサイクルの保持の分類体系には、データ ライフサイクル管理に対するさまざまな保持の分類が用意されています。 カスタム マイクロサービス ライフサイクル アプリケーションでこの体系を使用して、環境内でデータのライフサイクルを管理できます。
ビジネス用語集のデータ属性に、そのガバナンスを指定する機密性と保持の分類を使用してラベル付けまたはタグ付けを行います。 用語集の属性にラベルを付けると、その属性にマップされるデータの管理方法が基になるデータ ストアで自動的に定義されます。 データ カタログでは、さまざまなデータ ストアの物理的なデータ属性がビジネス用語集の属性にマップされます。
複数のテクノロジをデータ カタログと統合することで、これらの属性にアクセスし、分散データ ランドスケープ内のすべてのデータ ストアにわたってポリシーとルールを適用できます。 同じ分類ラベルを非構造化データに適用することもできます。
マスター データ エンティティは、そのデータが広く共有されるため、重要です。 マスター データ エンティティは、ドキュメントに関連付けられることがよくあります。 顧客と請求書、仕入先と契約、資産と運用マニュアルは、マスター データ エンティティとドキュメントのペアリングの例です。 この種類の接続を使用すると、マスター データ値 (仕入先名など) を使用して関連ドキュメントにタグを付け、構造化と非構造化のデータの間のリレーションシップを保持できます。
データ カタログの一般的なボキャブラリ データ エンティティを使用することにより、信頼できるデータ資産を作成するパイプラインを作成できます。 次に、共有できるようにデータ マーケットプレースでこれらの資産を公開できます。
重要なポイントは、使用可能なデータ ガバナンス方法を使用して、データを制御できることです。 データが信頼されたら、そのデータを使用して価値を生み出すことができます。 データ ガバナンスの整理と調整がどれだけ優れているかによって、成功のレベルが決まります。
データ ガバナンス成熟度モデル
データ ガバナンス成熟度モデルでは、データ ランドスケープ全体のすべてのガバナンスの側面を対象に、能力の成熟度について説明します。 次の表は、データ ガバナンス成熟度モデルでの現在の位置を評価するのに役立ちます。
ユーザー
管理されていない | ステージ 1 | ステージ 2 | 完全に管理されている |
---|---|---|---|
関係者エグゼクティブ スポンサーがいない | 関係者スポンサーがいる | 関係者スポンサーがいる | 関係者スポンサーがいる |
役割と責任がない | 役割と責任が定義されている | 役割と責任が定義されている | 役割と責任が定義されている |
データ ガバナンス コントロール ボードがない | データ ガバナンス コントロール ボードはあるがデータはない | データ ガバナンス コントロール ボードとデータがある | データ ガバナンス コントロール ボードとデータがある |
データ ガバナンス作業グループがない | データ ガバナンス作業グループがない | 一部のデータ ガバナンス作業グループがある | すべてのデータ ガバナンス作業グループがある |
データの責任を負うデータ所有者がいない | データの責任を負うデータ所有者がいない | 一部のデータ所有者がいる | すべてのデータ所有者がいる |
データ品質の責任を負うデータ スチュワードがいない | データ品質のためのデータ スチュワードが数名いるが、部門全体など、その範囲が広すぎる | データ スチュワードがいて、特定のデータのデータ ガバナンス作業グループに割り当てられている | データ スチュワードがいて、特定のデータのデータ ガバナンス作業グループに割り当てられている |
データのプライバシーの責任を負う人がいない | データのプライバシーの責任を負う人がいない | Chief Privacy Officer がプライバシーの責任を負う (ツールなし) | Chief Privacy Officer がプライバシーの責任を負う (ツールあり) |
アクセス セキュリティの責任を負う人がいない | IT がアクセス セキュリティの責任を負う | IT セキュリティがアクセス セキュリティの責任を負う | IT セキュリティがアクセス セキュリティとプライバシー適用の責任を負う |
信頼できるデータ資産プロデューサーがいない | データ発行者が特定され、信頼できるデータの責任を負う | データ発行者が特定され、信頼できるデータの責任を負う | データ発行者が特定され、信頼できるデータの責任を負う |
データ エンティティに対して領域の専門家 (SME) が特定されていない | 一部の SME は特定されているが、関与していない | SME が特定され、データ ガバナンス共同作業グループに含まれる | SME が特定され、データ ガバナンス共同作業グループに含まれる |
Process
管理されていない | ステージ 1 | ステージ 2 | 完全に管理されている |
---|---|---|---|
一般的なビジネス ボキャブラリがない | 一般的なビジネス ボキャブラリの用語集の作成が開始されている | 一般的なビジネス ボキャブラリが確立されている | 一般的なビジネス ボキャブラリが完成し、保守されている |
データの場所、品質、秘密度を知る方法がない | 一部のシステムで、データ カタログの自動データ検出、プロファイリング、機密データ検出が行われる | すべての構造化データで、データ カタログの自動データ検出、プロファイリング、機密データ検出が行われる | すべてのシステムの構造化と非構造化データで、データ カタログの自動データ検出、プロファイリング、機密データ検出が行われ、完全に自動的にタグ付けされる |
ポリシーとルールの作成またはメンテナンスを管理するプロセスがない | 一部のシステムで、データ アクセス セキュリティ、ポリシーの作成、メンテナンスのガバナンスが行われる | データ アクセス セキュリティ、プライバシー、保持ポリシーの作成とメンテナンスのガバナンス | データ アクセス セキュリティ、プライバシー、保持ポリシーの作成とメンテナンスのガバナンス |
ポリシーとルールを適用する方法がない | カタログ統合なしで、システム間でのデータ アクセス セキュリティ ポリシーとルールの段階的な適用 | カタログ統合ありで、システム間でのデータ アクセス セキュリティおよびプライバシー ポリシーとルールの適用 | すべてのシステムでのデータ アクセス セキュリティ、プライバシー、保持ポリシーとルールの適用 |
データ品質、データ プライバシー、データ アクセス セキュリティを監視するプロセスがない | データ品質を監視する一部の機能、プライバシーを監視する一部の機能 (クエリなど) | データベース管理システム (DBMS) マスクを使用したコア システムでのデータ品質とデータ プライバシーの監視と管理 | 動的マスクを使用したすべてのシステムでのデータ品質とデータ プライバシーの監視と管理 |
完全に信頼されたデータ資産を利用できない | データ ファブリック ソフトウェアを使用して、信頼されたデータ資産の小さなセットでの開発が開始されている | データ ファブリックを使用して作成された、いくつかの主要な信頼されたデータ資産 | エンタープライズ データ マーケットプレースを介した、信頼されたデータ資産の継続的デリバリー |
ポリシー違反が発生したかどうかの検知や、発生した場合の処理の方法がない | 一部のシステムでのデータ アクセス セキュリティ違反の検出 | すべてのシステムでのデータ アクセス セキュリティ違反の検出 | すべてのシステムでのデータ アクセス セキュリティ違反の検出 |
脆弱性テスト プロセスがない | 限定的な脆弱性テスト プロセス | すべてのシステムに対する脆弱性テスト プロセス | すべてのシステムに対する脆弱性テスト プロセス |
マスター データの作成、保守、同期に共通のプロセスがない | 1 つのエンティティの共通マスター データ作成、読み取り、更新、削除 (CRUD) および同期プロセスを使用したマスター データ管理 (MDM) | いくつかのデータ エンティティについての共通マスター データ CRUD と同期プロセスを含む MDM | すべてのマスター データ エンティティについての共通マスター データ CRUD と同期プロセスを含む MDM |
ポリシー
管理されていない | ステージ 1 | ステージ 2 | 完全に管理されている |
---|---|---|---|
機密性と保持についてのデータ ガバナンス分類体系がない | 機密性についてのデータ ガバナンス分類体系 | 機密性と保持両方についてのデータ ガバナンス分類体系 | 機密性と保持両方についてのデータ ガバナンス分類体系 |
データ品質を管理するポリシーとルールがない | ビジネス用語集の共通ボキャブラリでデータ品質を管理するポリシーとルールが作成され始めている | カタログ ビジネス用語集の共通ボキャブラリでデータ品質を管理するポリシーとルールが定義されている | カタログ ビジネス用語集の共通ボキャブラリでデータ品質を管理するポリシーとルールが定義されている |
データ アクセス セキュリティを管理するポリシーとルールがない | さまざまなテクノロジでデータ アクセス セキュリティを管理するいくつかのポリシーとルールが作成されている | データ アクセス セキュリティを管理するポリシーとルールが、分類体系を使用してデータ カタログに統合されている | データ アクセス セキュリティを管理するポリシーとルールが、分類体系を使用してデータ カタログに統合されていて、すべての場所に適用されている |
データ プライバシーを管理するポリシーとルールがない | データ プライバシーを管理するポリシーとルールがいくつかある | データ プライバシーを管理するポリシーとルールが、分類体系を使用してデータ カタログに統合されている | データ プライバシーを管理するポリシーとルールが、分類体系を使用してデータ カタログに統合されていて、すべての場所に適用されている |
データ保持を管理するポリシーとルールがない | データ保持を管理するポリシーとルールがいくつかある | データ保持を管理するポリシーとルールが、分類体系を使用してデータ カタログに統合されている | データ保持を管理するポリシーとルールが、分類体系を使用してデータ カタログに統合されていて、すべての場所に適用されている |
マスター データのメンテナンスを管理するポリシーとルールがない | 単一のマスター データ エンティティについて、マスター データのメンテナンスを管理するポリシーとルールがある | いくつかのマスター データ エンティティについて、マスター データのメンテナンスを管理するポリシーとルールがある | すべてのマスター データ エンティティについて、マスター データのメンテナンスを管理するポリシーとルールがある |
テクノロジ
管理されていない | ステージ 1 | ステージ 2 | 完全に管理されている |
---|---|---|---|
自動データ検出、プロファイリング、機密データ検出を備えたデータ カタログがない | 自動データ検出、プロファイリング、機密データ検出を備えたデータ カタログが購入されている | 自動データ検出、プロファイリング、機密データ検出を備えたデータ カタログが購入されている | 自動データ検出、プロファイリング、機密データ検出を備えたデータ カタログが購入されている |
マルチクラウド エッジとデータセンター接続を備えたデータ ファブリック ソフトウェアがない | マルチクラウド エッジ、データセンター接続、カタログ統合を備えたデータ ファブリック ソフトウェアが購入されている | マルチクラウド エッジ、データセンター接続、カタログ統合を備えたデータ ファブリック ソフトウェアが購入されている | マルチクラウド エッジ、データセンター接続、カタログ統合を備えたデータ ファブリック ソフトウェアが購入されている |
メタデータ系列がない | 信頼できる資産のデータ カタログで使用できるメタデータ系列が、ファブリックを使用して開発されている | 信頼できる資産のデータ カタログで使用できるメタデータ系列が、ファブリックを使用して開発されている | 信頼できる資産のデータ カタログで使用できるメタデータ系列が、ファブリックを使用して開発されている |
データ スチュワードシップ ツールがない | データ ファブリック ソフトウェアの一部としてデータ スチュワードシップ ツールを利用できる | データ ファブリック ソフトウェアの一部としてデータ スチュワードシップ ツールを利用できる | データ ファブリック ソフトウェアの一部としてデータ スチュワードシップ ツールを利用できる |
データ アクセス セキュリティ ツールがない | 複数のテクノロジでのデータ アクセス セキュリティ | 複数のテクノロジでのデータ アクセス セキュリティ | すべてのシステムで適用されるデータ アクセス セキュリティ |
データ プライバシー適用ソフトウェアがない | データ プライバシー適用ソフトウェアがない | 一部のデータベース管理システムにデータ プライバシー適用ソフトウェアがある | すべてのデータ ストアにデータ プライバシー適用ソフトウェアがある |
MDM システムがない | 単一エンティティの MDM システム | 複数エンティティの MDM システム | 複数エンティティの MDM システム |
データ ガバナンス成熟度の概要
ガバナンス成熟度モデルの中での現在位置を確認できたら、主な利害関係者と相談して、成熟度を高めるための戦略を策定します。 まず、要件、テクノロジ、データ品質、メタデータ、データ共有、およびマスター データ戦略の定義から着手します。