アーキテクチャの概要
クラウド規模の分析フレームワークのデータ アーキテクチャの構築を開始する前に、次の表の記事を確認してください。
セクション | 説明 |
---|---|
初期戦略の構築 | データの戦略と要点を構築し、データ主導型の組織になる方法。 |
計画の定義 | クラウド規模の分析に向けた計画を作成する方法。 |
分析資産の準備 | エンタープライズ登録、ネットワーキング、ID およびアクセス管理、ポリシー、ビジネス継続性、ディザスター リカバリーなどの主要な設計領域に関する考慮事項を含む、クラウド規模の分析資産の準備の概要。 |
分析の管理 | データ、データ カタログ、系列、マスター データ管理、データ品質、データ共有契約、メタデータを管理するための要件。 |
分析資産のセキュリティ保護 | 認証と承認、データ プライバシー、データ アクセス管理を使用して分析資産をセキュリティで保護する方法。 |
人とチームの整理 | 望ましい結果を生む運用、役割、チーム、チームの機能を整理する方法。 |
分析資産の管理 | シナリオのプラットフォームと監視をプロビジョニングする方法。 |
物理アーキテクチャ
クラウド規模の分析の物理的な実装は、データ管理ランディング ゾーンとデータランディング ゾーンという 2 つの主要アーキテクチャで構成されます。
データ アプリケーション
データ アプリケーションは、データ製品を提供するための中核的な概念であり、レイクハウスとデータ メッシュ パターンの両方に合わせて調整できます。
クラウド規模の分析
複数のデータ ランディング ゾーンを使用して、クラウド規模の分析のデプロイをスケーリングできます。
データ メッシュ
クラウド規模の分析を使用してデータ メッシュを実装します。 クラウド規模の分析に関するガイダンスの大部分が当てはまりますが、データ ドメイン、セルフサービス データ プラットフォーム、オンボード データ製品、ガバナンス、データ マーケットプレース、データ共有については、注意すべき違いがいくつかあります。
クラウド規模の分析用のデプロイ テンプレート
次の表に、デプロイできる参照テンプレートの一覧を示します。
リポジトリ | コンテンツ | 必須 | デプロイメント モデル |
---|---|---|---|
データ管理テンプレート | 中央データ管理サービスと共有データ サービス (データ カタログやセルフホステッド統合ランタイムなど) | はい | クラウド規模の分析ごとに 1 つ |
データ ランディング ゾーン テンプレート | データ ランディング ゾーン共有サービス (インジェスト、管理、データ ストレージ サービスを含む) | はい | データ ランディング ゾーンごとに 1 つ |
データ統合テンプレート - バッチ処理 | バッチ データ処理に必要な追加サービス | No | データ ランディング ゾーンごとに 1 つまたは複数 |
データ統合テンプレート - ストリーム処理 | データ ストリーム処理に必要な追加サービス | No | データ ランディング ゾーンごとに 1 つまたは複数 |
データ製品テンプレート - 分析とデータ サイエンス | Data Analytics と AI に必要な追加サービス | No | データ ランディング ゾーンごとに 1 つまたは複数 |
これらのテンプレートには、Azure Resource Manager テンプレート、それらのテンプレートのパラメーター ファイル、リソース デプロイ用の CI/CD パイプライン定義が含まれます。
テンプレートは、新しい Azure サービスや要件のため、時間の経過とともに変更される可能性があります。 各リポジトリのメイン ブランチをセキュリティで保護し、エラーがなく使用やデプロイの準備が整った状態が維持されるようにします。 機能強化をメイン ブランチにマージする前に、開発サブスクリプションを使用してテンプレート構成の変更をテストします。
環境へのプライベートな接続
参照アーキテクチャは、設計上安全です。 多層のセキュリティ アプローチを使用して、一般的なデータ流出リスクを克服しています。
セキュリティに関する最も簡単な解決策は、データ管理ランディング ゾーンまたはデータ ランディング ゾーンの仮想ネットワークでジャンプボックスをホストして、プライベート エンドポイント経由でデータ サービスに接続することです。
よく寄せられる質問
クラウド規模の分析に関する質問と回答の一覧については、よく寄せられる質問に関するページを参照してください。