クラウド規模の分析の概要
クラウド規模の分析は、デプロイとガバナンスを簡素化するために、Azure ランディング ゾーンに基づいて構築されます。 Azure ランディング ゾーンの主な目的は、アプリケーションまたはワークロードを Azure にデプロイするときに、必要なインフラストラクチャが既に配置されていることを確認することです。 クラウド規模の分析ランディング ゾーンをデプロイする前に、azure 用の
ソブリン ワークロードの場合、Microsoft はエンタープライズ規模の Azure ランディング ゾーンの一種である ソブリン ランディング ゾーン (SLZ)を提供します。 SLZ は、高度なソブリン制御を必要とする組織を対象としています。 クラウド規模の分析は、この Azure ランディング ゾーンバリアントに対してデプロイできます。
クラウド規模の分析には、アプリケーション ランディング ゾーンへのデプロイが含まれます。 通常、これらのゾーンはランディング ゾーン管理グループの下に存在します。 ポリシーは、Microsoft が提供するサンプル テンプレートに絞り込まれます。
これらのサンプル テンプレートは、data lakehouse と データ メッシュ デプロイに使用できます。
クラウド規模の分析の評価
多くの場合、企業は、特定のユース ケースやプロジェクト、またはエンド ツー エンドのクラウド規模分析の技術的な詳細の定義を開始する前に、明確さや規範的なガイダンスを求めています。 ビジネスが全体的なデータ戦略を策定するにつれて、現在の使用の範囲で必要なすべての戦略原則を確実に考慮することは困難な場合があります。
これらの課題を考慮しながら、このエンドツーエンドの分析情報の実装を迅速化するために、Microsoft はクラウド規模の分析の規範的なシナリオを開発しました。 これは、クラウド規模の分析の計画を策定する
クラウド規模の分析は、クラウド導入フレームワークに基づいて構築され、Azure Well-Architected Framework の原則を適用します。 クラウド導入フレームワークには、クラウド運用モデル、参照アーキテクチャ、プラットフォーム テンプレートに関する規範的なガイダンスとベスト プラクティスが用意されています。 このガイダンスは、最も困難で洗練された複雑な環境の一部からの実際の経験に基づいています。
クラウド規模の分析は、分析ワークロードをホストおよび実行するためのランディング ゾーンの構築と運用化の準備に役立ちます。 強化されたセキュリティ、ガバナンス、コンプライアンスの基盤にランディング ゾーンを構築します。 ランディング ゾーンはスケーラブルでモジュール式ですが、自律性とイノベーションをサポートします。
データ アーキテクチャの歴史
1980 年代後半に、データ ウェアハウス第 1 世代が導入されました。 このモデルは、企業全体の異なるデータ ソースを結合します。 2000 年代後半には、第 2 世代が登場し、Hadoop やデータ レイクなどのビッグ データ エコシステムが導入されました。 2010 年代半ばには、クラウド データ プラットフォームが導入されました。Kappa や Lambda アーキテクチャなどのストリーミング データ インジェストが導入されました。 2020 年代初頭には、データ レイクハウス、データ メッシュ、データ ファブリック、データ中心の運用パターンが導入されました。
これらの進歩にもかかわらず、多くの組織では引き続き一元化されたモノリシック プラットフォーム (第 1 世代) を使用しています。 このシステムはある程度まで問題なく機能します。 ただし、相互に依存するプロセス、緊密に結合されたコンポーネント、極度に専門化が進んだチームが原因でボトルネックが発生する可能性があります。 抽出、変換、読み込み (ETL) のジョブが目立つようになり、配信のスケジュールに遅れが出る可能性があります。
データ ウェアハウスとデータ レイクは引き続き価値があり、アーキテクチャ全体で重要な役割を果たします。 次のドキュメントでは、これらの従来のスケーリングプラクティスを使用する場合に発生する可能性があるいくつかの課題について説明します。 これらの課題は特に、データ ソース、要件、チーム、出力が変化する複雑な組織に関連しています。
クラウド規模の分析への移行
現在の分析データ アーキテクチャと運用モデルに、データ ウェアハウス、データ レイク、データ レイクハウス構造、データ ファブリック、またはデータ メッシュを含めることができます。
各データ モデルには、独自のメリットと課題があります。 クラウド規模の分析を使用すると、現在のアプローチをデータ管理に移行して、インフラストラクチャと共に進化させることができます。
基盤として機能し、スケーリングが実現されるエンド ツー エンドのクラウド規模の分析フレームワークを作成するために、どのデータ プラットフォームやシナリオでもサポートできます。
最新のデータ プラットフォームと必要な結果
最初の手順の 1 つは、スケーラブルでアジャイルな最新のデータ プラットフォームを繰り返し構築することで、課題に対応するためにデータ戦略をアクティブ化することです。
サービス チケットに圧倒され、競合するビジネス ニーズを満たそうとするのではなく、最新のデータ プラットフォームを実装するときに、より有益な作業に集中するための時間を解放できるため、よりコンサルティング的な役割を果たすことができます。 データと分析のニーズに関するセルフサービスを提供するためには、プラットフォームとシステムを使用して基幹業務を提供します。
最初の焦点として推奨される領域を次に示します。
- データ主導でビジネス上の意思決定を行うために、データ品質を向上させ、信頼を促進し、分析情報を得ます。
- 組織全体に包括的なデータ、管理、分析を大規模に実装します。
- 基幹業務のセルフサービスと柔軟性を実現する堅牢なデータ ガバナンスを確立します。
- 完全に統合された環境でセキュリティと法的コンプライアンスを維持します。
- 高度な分析機能の基盤を迅速に作成するには、適切に設計された反復可能なモジュールパターンのすぐに使用できるソリューションを使用します。
分析資産の管理
2 つ目の考慮事項は、組織がデータ ガバナンスを実装する方法を決定することです。
データ ガバナンスとは、ビジネス運用、レポート、分析で使用するデータが検出可能で正確で信頼できるデータであり、保護できることを保証するプロセスです。
多くの企業で期待されることは、データと AI によって競争上の優位性を高めることです。 その結果、経営幹部は、データ駆動型になるという決意で AI イニシアチブを後援することに熱心に取り組みます。 ただし、AI を有効にするには、信頼できるデータを使用する必要があります。 そうしないと、意思決定の正確性が損なわれる可能性があり、決定が遅れる可能性があります。または、アクションが見逃され、結果に影響を与える可能性があります。 企業は、データの品質が低いことを望んでいません。 デジタル変革がデータに与えた影響を確認するまで、データ品質を修正するのは簡単に思えるかもしれません。
ハイブリッド マルチクラウドと分散データ ランドスケープにデータが分散している組織は、データの場所を見つけて管理することに苦労しています。 管理されていないデータは、ビジネスに大きな影響を与える可能性があります。 データの品質が低いと、データ エラーによってプロセス エラーと遅延が発生するため、ビジネス操作に影響します。 また、データ品質が低い場合、ビジネス上の意思決定やコンプライアンスを維持する機能にも影響します。 分析システムで品質の問題を修正する方が、インジェスト フェーズの早い段階でデータ品質ルールを適用するよりも複雑でコストがかかる可能性があるため、多くの場合、ソースでデータ品質を確保することをお勧めします。です。 データ アクティビティの追跡と管理を支援するには、データ ガバナンスに次のものが含まれている必要があります。
- データ検出。
- データ品質。
- ポリシーの作成。
- データ共有。
- メタデータ。
分析資産のセキュリティ保護
データ ガバナンスを推進するもう 1 つの大きな要因は、データ保護です。 データ保護は、規制に関する法律への準拠を確保し、データ侵害を防ぐのに役立ちます。 データのプライバシーと増加するデータ侵害により、データ保護が最優先事項になっています。 データ侵害は、個人を特定できる顧客データなどの機密データに対するリスクを強調します。 データ プライバシー違反またはデータ セキュリティ侵害の結果には、次のようなものがあります。
- ブランドイメージに深刻なダメージを与えます。
- 顧客の信頼と市場シェアの損失。
- 利害関係者の投資収益率と役員給与に影響を与える株価の引き下げ。
- 監査またはコンプライアンスの失敗による重大な財務上のペナルティ。
- 法的措置。
- たとえば、侵害の二次的な影響は、顧客が個人情報の盗難の被害を受ける可能性があります。
ほとんどの場合、上場企業は侵害を報告する必要があります。 侵害が発生した場合、顧客はハッカーではなく会社を非難する可能性があります。 顧客は、数か月間会社をボイコットしたり、戻ったりしない可能性があります。
データ プライバシーに関する規制法令への準拠に失敗すると、多額の制裁金が発生する可能性があります。 データの管理は、これらのリスクを回避するのに役立ちます。
運用モデルと利点
最新のデータ戦略プラットフォームを採用しても、組織が使用するテクノロジが変わるだけではありません。 また、組織の運用方法も変更されます。
クラウド規模の分析では、次のような従業員の整理とトレーニングに役立つガイダンスが提供されます。
- ペルソナ、ロール、責任の定義。
- アジャイル、垂直、クロスドメイン の各チームに推奨される構造。
- Microsoft Learn を使用した Azure データと AI 認定を含むトレーニング リソース。
また、最新化プロセスを通じてエンド ユーザーを引き付け、プラットフォームを進化させ、新しいユース ケースをオンボードし続けるのも重要です。
アーキテクチャ
Azure ランディング ゾーンは、環境の戦略的設計パスと、技術的に目指している状態を表します。 展開とガバナンスが容易になり、機敏性とコンプライアンスを向上させることができます。 また、新しいアプリケーションまたはワークロードが環境に追加されたときに、適切なインフラストラクチャが既に配置されていることを確認します。 Microsoft サービスとしてのソフトウェア (SaaS) のガバナンスおよび分析ソリューションと統合された Azure データ管理とデータ ランディング ゾーンは、これらの基本原則を念頭に置いて設計されており、クラウド規模の分析の他の要素と組み合わせると、次のことが可能になります。
- セルフサービス。
- スケーラビリティ。
- 早いスタート。
- 安全。
- プライバシー。
- 最適化された操作。
データ管理ランディング ゾーン
データ管理ランディング ゾーンでは、組織全体にわたり、プラットフォームの一元化されたデータ ガバナンスと管理の基盤が提供されます。 また、マルチクラウドやハイブリッド インフラストラクチャなど、デジタル資産全体からデータを取り込むための通信も容易になります。
データ管理ランディング ゾーンでは、以下のような、データ管理とガバナンスに関するその他の機能が多数サポートされています。
- データ カタログ。
- データ品質管理。
- データ分類。
- データ系列。
- データ モデリング リポジトリ。
- API カタログ。
- データ共有とコントラクト。
ヒント
データ カタログ、データ品質管理、またはデータ系列の機能にパートナー ソリューションを使用する場合は、データ管理ランディング ゾーンに存在する必要があります。 または、Microsoft Purview を SaaS ソリューションとしてデプロイし、データ管理ランディング ゾーンとデータ ランディング ゾーンの両方に接続することもできます。
データのランディング ゾーン
データ ランディング ゾーンは、データ管理ランディング ゾーンへの接続を介して共通の管理とガバナンスを維持しながら、データをユーザーに近づけ、セルフサービスを実現します。
データ製品や視覚化などのカスタマイズに加えて、ネットワーク、監視、データの取り込みと処理などの標準サービスをホストします。
データ ランディング ゾーンは、プラットフォームのスケーラビリティを実現する鍵です。 組織の規模とニーズに応じて、1 つまたは複数のランディング ゾーンから開始できます。
単一のランディング ゾーンと複数のランディング ゾーンを決定する場合は、リージョンの依存関係とデータ所在地の要件を考慮してください。 たとえば、データを特定の場所に留めることが求められる地域の法律や規制が存在するか、などです。
データ ランディング ゾーンは、最初の決定にかかわらず、必要に応じて追加または削除できます。 1 つのランディング ゾーンから始める場合は、移行の将来のニーズを回避するために、複数のランディング ゾーンに拡張することを計画することをお勧めします。
Note
Microsoft Fabric がデプロイされている場合、データ ランディング ゾーンは、データ レイクやその他の Azure データ サービスなどの SaaS 以外のソリューションをホストします。
ランディング ゾーンの詳細については、「クラウド規模の分析のための Azure ランディング ゾーン」を参照してください。
まとめ
このドキュメント セット、特にガバナンス、セキュリティ、運用、ベスト プラクティスの各セクションを読んだ後は、デプロイ テンプレートを使用して概念実証環境を設定することをお勧めします。 これらのテンプレートとアーキテクチャ ガイダンスを使用すると、Azure および Microsoft SaaS テクノロジの一部を実際に体験できます。 詳細については、「作業開始のチェックリスト」を参照してください。