データ ガバナンスの要件
クラウド規模の分析では、データを管理する際に次の要件を考慮する必要があります。
- ビジネス用語集で共通のビジネス ボキャブラリを作成するためのデータ エンティティの定義 このコンテキストにおけるデータ エンティティは、顧客、サプライヤー、材料、従業員などの概念を意味します。
- データ エンティティの識別と検出
- データのアクセス セキュリティ、データのプライバシー、データ保持を管理するためのデータの分類
- ガバナンスの説明責任を持つデータ所有者や、データの保護と品質に責任を持つデータ スチュワードなどのユーザー。
- データ ガバナンスのプロセス。
- データの保持期間を管理するデータ ライフサイクル管理
- 特定のデータをそのライフサイクル全体で管理する方法を定義するポリシーとルール。
- 分散データのランドスケープ内にあるデータ ストア全体でのポリシーの適用。
- 顧客、製品、サプライヤーなどの運用システムと分析システム全体でデータの一貫性を保つためのマスター データ管理。
- データ エンティティの変換とリレーションシップを理解するためのメタデータ系列。
- 構造化データ、多層構造データ、非構造化データの管理を可能にするテクノロジ。 ガバナンスは、データセンター、複数のクラウド、エッジにまたがる場合があります。
1 つの課題は、データが企業全体の複数の場所で収集および格納されていることです。 データには、さまざまな地域やさまざまな法域で収集および格納されたデータが含まれる場合があります。 その結果、同じデータを管理するために、法域によって異なる法律が適用される可能性があります。 複数のクラウドと地理的な場所に分散されたデータを検出して、次のことを行います。
- 分散データのランドスケープ全体に存在するデータ属性、データ エンティティ、データの関係を理解する。
- ガバナンス方法を知るためにデータを分類する
- データ分類とライフサイクル管理の種類ごとにデータの管理方法を指定するポリシーを定義する。
- 分散データのランドスケープ全体にデータの品質、データのアクセス セキュリティ、データのプライバシー、ライフサイクル管理に関するポリシーを適用する。
データ分類
データ分類とは、データ資産に一意の論理タグやクラスを割り当てることでデータ資産を分類する手段です。 分類はデータのビジネス コンテキストによって決まります。
データの機密性レベルと保持期間を理解するためにデータを分類する方法が必要です。 分類には次のものが必要です。
- データの機密性の分類体系
- データ保持の分類体系
データ機密性の分類体系
分類 | 説明 |
---|---|
パブリック | このデータは、誰もがアクセスでき、誰にでも送信できます。 たとえば、政府の公開データなどです。 |
内部でのみ使用されます | このデータは、従業員のみがアクセスでき、社外に送信することはできません。 |
機密 | このデータは、特定のタスクに必要な場合にのみ共有できます。 このデータは、機密保持契約を結ばずに社外に送信することはできません。 |
機微 (個人データ) | このデータには、マスクする必要がある非公開の情報が含まれており、知る必要がある場合にのみ、限定された期間共有されます。 このデータは、承認されていない担当者や社外に送信することはできません。 |
制限付き | このデータは、その保護に責任を負う指定された個人とのみ共有できます。 たとえば、法的文書や営業秘密などです。 |
データ ライフサイクルの保持の分類体系
保持 | 説明 |
---|---|
なし | データはいつでも削除できます。 |
一時 | データを短期間保持します。 たとえば、Twitter データを 1 週間保持します。 |
固定期間 | データは一定の年数保持し、その後は削除できます。 たとえば、政府の法律を遵守するために、納税記録を 7 年間保持します。 |
永続的 | データは削除されません。 たとえば、法的対応などです。 |
分散データのランドスケープ全体でデータに一貫してラベルを付けるために、各体系で定義されたクラスを使用して、データの機密性とデータ ライフサイクル保持の分類プロセスを自動化する必要があります。 自動化により、一貫性のある適切な管理が可能になります。 次に、分類に従ってデータを管理する方法を指定するために、分類体系のクラスごとにルールとポリシーを定義します。
データ ガバナンスの役割と責任
もう 1 つの要件は、説明責任の必要性です。 説明責任がなければ、データ ガバナンスの責任の所在についていつまでも混乱が続くことになります。 説明責任がない場合、次の質問にどのように回答しますか?
- 成功指標を設定し、データ ガバナンス プログラムがどの程度うまく機能しているかを監視するのは誰ですか?
- データ所有者は誰ですか?
- ビジネス用語集を定義し、保守するのは誰ですか?
- アクセス セキュリティに関するポリシーを作成し、保守するのは誰ですか?
- コンプライアンスのために個人データのプライバシーを保護しているのは誰ですか?
- すべてのパンフレットとパートナー Web サイトの製品データの品質を管理しているのは誰ですか?
- 顧客データがすべてのシステムで一貫していることを保証するのは誰ですか?
- サブスクリプション データの外部使用とライセンスを管理しているのは誰ですか?
- データベース管理者やデータ科学者などの特権ユーザーを管理しているのは誰ですか?
- それは C レベルの役員ですか? 部長ですか?
- ガバナンス、リスク、コンプライアンスの責任者ですか?
- 法務部門ですか?
- IT 部門の責任ですか?
混乱を避け、データ文化を実現できる基盤を確立するには、役割と責任が必要です。
データ ガバナンスのプロセス
役割と責任と共に、次のプロセスが必要です。
- 一般的なビジネス ボキャブラリの定義とメンテナンスを管理する
- 保持しているデータ、その意味、保存場所を検出して識別する
- ガバナンス方法を知るためにデータを分類する
- データのアクセス セキュリティ ポリシーの定義とメンテナンスを管理する
- データのプライバシー ポリシーの定義とメンテナンスを管理する
- データ品質の問題を検出して修復する
- コンプライアンスのために、確実にポリシーを適用して、措置を講じる
- マスター データのメンテナンスを管理する
データ ガバナンスのポリシーとルール
次のものを管理するためのポリシーとルールを定義します。
- データ整合性ルール
- データ インジェストに関するポリシーとルール
- データのアクセス セキュリティに関するポリシーとルール
- データのプライバシー ポリシーとルール
- データの品質に関するポリシーとルール
- データのメンテナンスに関するポリシーとルール
- データ保持に関するポリシーとルール
これらのポリシーとルールを、データ ガバナンスの分類体系の各クラスに関連付けます。
マスター データの管理
データ ガバナンスでのもう 1 つの要件は、マスター データ管理です。 マスター データは、どの組織でも最も広く共有されるデータであり、コア データ エンティティが含まれています。 コア データ エンティティとしては、顧客、サプライヤー、材料、従業員、資産があります。 また、さまざまな財務アプリケーションで見られる財務勘定科目のデータも含まれます。 マスター データは非常に広い範囲で共有されるため、アプリケーションに依存しません。 これは、運用トランザクション処理アプリケーションと分析システムの両方で必要です。 このデータの同期を維持することで、非常に多くのデータ エラーやプロセス エラーを解決できます。 このため、共通のプロセスを介して一元的に保守し、これを必要とするすべてのシステムを同期するのが理想的な状況です。 また、マスター データのメンテナンスを許可されている人、およびメンテナンスが必要な場所についてもガバナンスが必要です。
コード セットや金融市場データなどの参照データについても同じことが当てはまります。 この場合、コード セットの標準化と同期は参照データ管理と呼ばれており、これも要件です。
メタデータ系列
最後に、メタデータ系列の要件があります。 監査証跡を使用すると、データがどこから発生し、レポートまたはデータ ストアへの経路でどのように変換されたかを知ることができます。 メタデータを使用すると、発生する時期と場所を含め、誰がどのデータを保守しているかを追跡できます。
エンドツーエンドのデータ ガバナンスに必要な要素の概要
エッジ内のデータ ストア、複数のクラウド、データセンター全体にわたって、データをそのライフサイクル全体で管理できるエンドツーエンドのソリューションが必要です。
データ ガバナンス ソリューションには、いくつかのコンポーネントが必要です。
- データ ガバナンスのビジョンと戦略
- データ自体 (顧客データ、サプライヤー データ、注文データなど)。
- 作成から廃棄まで、データ ガバナンスが必要なデータ ライフサイクル。
- データ ガバナンスの役割と責任 (要員)。
- データ ガバナンスのプロセスとアクティビティ、およびそれらをデータ ライフサイクルに適用する方法。
- ライフサイクルの異なる時点でデータを管理するためのポリシーとルール。
- データ ガバナンスを可能にするために役立つデータ ガバナンス テクノロジ。