作業開始のチェックリスト
クラウド規模の分析を使用してデータに取り組む場合、その導入ライフサイクルには複数のステージがあります。 このセクションでは、シナリオを段階的に導入するのに役立つように、作業開始のための簡単なチェックリストを示します。 次のステージがあります。
- ステージ 1: 最初のランディング ゾーン
- ステージ 2: 追加のデータ ドメイン
- ステージ 3: 使用の準備状況を改善する
- ステージ 4: 重要なガバナンス コンポーネント
ステージ 1 - 最初のランディング ゾーン
- 最初のユース ケースを定義する
- 最初のデータ管理ランディング ゾーンをデプロイする
- 最初のデータ ランディング ゾーンをデプロイする
- 最初の (インジェスト) パターン (バッチ Parquet など) を定義する
- 最初のデータ製品を開発する (未加工で取り込まれ、製品に抽象化される)
- "必要最小限" のガバナンスを決定する
- メタデータの要件 (アプリケーション情報、スキーマ メタデータ) を定義する
- 最初のデータ コンシューマーを登録する (手動のプロセス)
ステージ 2 - 追加のデータ ドメイン
- ターゲット アーキテクチャに修正を加える
- より多くのデータ ランディング ゾーンをデプロイする
- 2 番目、3 番目、4 番目のデータ製品を加えて拡張する
- データ製品のメタデータ リポジトリ (データベースまたは Excel) を実現する
- コントロールの最初のセット (データ品質、スキーマ検証) を実装する
- 使用する側のパイプラインを実現する (出力としての入力を受け取る)
- データの所有権を確立する
ステージ 3 - 使用の準備状況を改善する
- セルフサービスの登録とメタデータのインジェストを実装する
- その他の変換パターン (変換フレームワーク、ETL ツールなど) を提供する
- プロバイダー側のコントロール (用語集、系列、リンケージ) を強化する
- 使用する側のプロセス (承認、ユース ケースのメタデータ、手動での安全なビューのデプロイ) を実装する
- データ ガバナンス コントロール ボードを設立する
ステージ 4 - 重要なガバナンス コンポーネント
- 自動化 (セキュリティで保護されたビューの自動プロビジョニング) を適用する
- 強力なデータ ガバナンスをデプロイし、争議調停機関を設ける
- データ製品のガイドラインを完成させる
- 追加の相互運用性標準を定義する
- セルフサービスのデータ使用プロセスを開発する
- データ クエリ、セルフサービス、カタログ、系列の機能などを開発する
- より多くのデータ マーケットプレース機能を開発する。
まとめ
これら 4 つの開発ステージに従うことで、ステージ 1 で実行可能な最小限の製品の設定と学習を繰り返して、ステージ 2 に進むことができます。 段階的なアプローチ全体を通して、スケーラブルで管理されたセルフサービス プラットフォームを作成する場合の成熟度が高まります。