次の方法で共有


作業開始のチェックリスト

クラウド規模の分析を使用してデータに取り組む場合、その導入ライフサイクルには複数のステージがあります。 このセクションでは、シナリオを段階的に導入するのに役立つように、作業開始のための簡単なチェックリストを示します。 次のステージがあります。

  • ステージ 1: 最初のランディング ゾーン
  • ステージ 2: 追加のデータ ドメイン
  • ステージ 3: 使用の準備状況を改善する
  • ステージ 4: 重要なガバナンス コンポーネント

ステージ 1 - 最初のランディング ゾーン

  • 最初のユース ケースを定義する
  • 最初のデータ管理ランディング ゾーンをデプロイする
  • 最初のデータ ランディング ゾーンをデプロイする
  • 最初の (インジェスト) パターン (バッチ Parquet など) を定義する
  • 最初のデータ製品を開発する (未加工で取り込まれ、製品に抽象化される)
  • "必要最小限" のガバナンスを決定する
  • メタデータの要件 (アプリケーション情報、スキーマ メタデータ) を定義する
  • 最初のデータ コンシューマーを登録する (手動のプロセス)

ステージ 2 - 追加のデータ ドメイン

  • ターゲット アーキテクチャに修正を加える
  • より多くのデータ ランディング ゾーンをデプロイする
  • 2 番目、3 番目、4 番目のデータ製品を加えて拡張する
  • データ製品のメタデータ リポジトリ (データベースまたは Excel) を実現する
  • コントロールの最初のセット (データ品質、スキーマ検証) を実装する
  • 使用する側のパイプラインを実現する (出力としての入力を受け取る)
  • データの所有権を確立する

ステージ 3 - 使用の準備状況を改善する

  • セルフサービスの登録とメタデータのインジェストを実装する
  • その他の変換パターン (変換フレームワーク、ETL ツールなど) を提供する
  • プロバイダー側のコントロール (用語集、系列、リンケージ) を強化する
  • 使用する側のプロセス (承認、ユース ケースのメタデータ、手動での安全なビューのデプロイ) を実装する
  • データ ガバナンス コントロール ボードを設立する

ステージ 4 - 重要なガバナンス コンポーネント

  • 自動化 (セキュリティで保護されたビューの自動プロビジョニング) を適用する
  • 強力なデータ ガバナンスをデプロイし、争議調停機関を設ける
  • データ製品のガイドラインを完成させる
  • 追加の相互運用性標準を定義する
  • セルフサービスのデータ使用プロセスを開発する
  • データ クエリ、セルフサービス、カタログ、系列の機能などを開発する
  • より多くのデータ マーケットプレース機能を開発する。

まとめ

これら 4 つの開発ステージに従うことで、ステージ 1 で実行可能な最小限の製品の設定と学習を繰り返して、ステージ 2 に進むことができます。 段階的なアプローチ全体を通して、スケーラブルで管理されたセルフサービス プラットフォームを作成する場合の成熟度が高まります。

次の手順