学習プロセス用の Azure テクノロジ
このユニットでは、イノベーション ライフサイクルに評価ステップの結果を適用する方法を学習します。 また、データの民主化の重要性についても学習します。
データの民主化
前のユニットで学習したように、複数のソースを使用して顧客からデータを収集できます。 これらのソースには、マイクロ アンケート、Azure Application Insights から取得した使用状況データ、およびお客様が独自に有効または無効にすることを決定できる機能フラグが含まれます。 データが多いほど、意思決定がより適切になりますが、この増え続けるデータ フローを処理する方法が必要です。
2014 年に Satya Nadella は、組織内のデータ文化の重要性について話しています。 彼によると、意思決定は、感情や主観的な意見に基づくのではなく、データを使用して検証することで行う必要があります。 データは、それを必要とするすべての個人が使用できるようにする必要があります。また、データ ドリブンな意思決定を容易にするために、実用的な分析情報に簡単に変換する必要があります。
組織は、広く使用されているデータの決定が堅固でアクセス可能なデータ プラットフォームに基づいている場合にのみ、それらのデータの決定を行うことができます。 この取り組みには、次の 4 つの領域が含まれます。
- データの収集: データ ドリブンな意思決定への最初のステップは、常にデータを持つことです。 データ収集には、既存のデータ リポジトリからの移行、Azure Application Insights などのソースからのデータ生成、他のソースからのデータの取り込みなど、複数の形式があります。
- データの共有: 収集したデータは、データの専門家だけでなく、必要なすべての人が使用できる必要があります。 組織内のすべてのユーザーは、データを使用して意思決定を行うことができます。
- データの一元化: 一元化されたデータ プラットフォームは、データの共有と管理を簡素化するのに役立ちます。
- データの管理: データ共有は、すべてのデータをすべての人が利用できるようにする必要があるという意味ではありません。 共有する前に、機密データがセキュリティ保護、追跡、および管理されていることを確認します。
Azure データ プラットフォーム
Azure プラットフォームはデータのライフサイクル全体をカバーします。これは、データ ドリブンな意思決定とデータ民主化の基礎となります。 軽量なオンデマンド データベースから大規模なデータ ウェアハウスや柔軟な NoSQL システムまで、Azure データ プラットフォームでは、次の 4 つのデータ アクティビティ領域に対応できます。
データ コレクション
Azure データ エコシステムには、データの移行、取り込み、格納、および分析を行うためのサービスとツールが含まれています。 次の一覧は、データ ドリブンの意思決定を容易にするために、データを処理して後で共有できるようにするために使用できるメカニズムのほんの一部を示しています。
- データ分析: Azure Synapse Analytics は、データ ウェアハウスやビッグ データ システム全体にわたって分析情報を取得する時間を早めるエンタープライズ分析サービスです。 Azure Synapse Analytics は、次の長所を兼ね備えています。
- エンタープライズ データ ウェアハウスで使用される SQL テクノロジ。
- ビッグ データに使用される Spark テクノロジ。
- データ統合と ETL (抽出、変換、読み込み) および ELT (抽出、読み込み、変換) のためのパイプライン。
- Power BI、Azure Cosmos DB、Azure Machine Learning などの他の Microsoft サービスとの緊密な統合。
- データの移行: データは既に既存のソースに格納されている場合がありますが、実用的な分析情報に変換するには、最新のプラットフォームに移行する必要があります。 Azure Database Migration Service には、SQL Server、PostgreSQL、Oracle、MongoDB などのシステムからのデータ移行を支援するツールが含まれています。
- データ処理: Azure には、Azure Stream Analytics でデータ ストリームを分析および変換するサービスと、Azure Data Factory を使用して大規模な ETL プロセスを実行するサービスが含まれています。
データ共有
Microsoft Power BI は、さまざまなソースからのデータを統合された対話的な視覚化に統合するための一連のツールです。 ユーザーは、直感的なコントロールを操作するだけでデータを調べることができます。 これにより、データ専門家だけでなく、組織内の全員が分析情報を利用できるようになります。
領域の所有者は、アプリケーションの特定の側面に関する関連情報を含むレポートとダッシュボードを作成できます。 仮説を検証する新機能を導入した後、実際の顧客の使用状況に基づいて仮説を検証または拒否するためのデータをすぐに利用できます。
Microsoft Power BI は、複数の観点からデータを共有するのに役立ちます。 次に例をいくつか示します。
- 同僚やパートナーとのデータの共有: Power BI ダッシュボードでは、データの使用が簡素化されます。 視覚化により、データの専門家ではない人が、基礎となる構造に精通していなくてもデータにドリルダウンすることができます。
- データ分析情報の迅速な生成: Power BI は、クイック分析情報機能を使用してデータセットの視覚化を自動的に生成できます。 ダッシュボードをすばやく作成して、最初は明らかではなかった可能性のあるデータの相関関係を見つけることができます。
- Web サイトまたはポータルにレポートを埋め込む: Power BI を使用すると、ネイティブ Power BI ポータルで視覚化にアクセスできるだけでなく、レポートやダッシュボードを他の Web アプリケーションに埋め込むこともできます。 これにより、ユーザーは、意思決定プロセスに必要なデータを見つけるために、使い慣れた企業 Web サイトから出る必要がありません。
データの一元化
データの集中化の主な問題は、さまざまなレベルでの拡張です。 単純化しすぎる恐れはありますが、ビッグ データの次の 3 つの V にまで減らすことができます。
- ボリューム: Azure Data Lake Storage Gen2 は、コスト効率が高く、スケーラブルなデータ ストレージ用の Azure プラットフォームです。 Azure Storage によって提供される大規模なスケーラビリティに基づき、Azure Data Lake Storage は、数百ギガビットのスループットを維持しながら、複数のペタバイトの情報を提供するように設計されています。
- 多様性: この用語は、データが常に構造化されているとは限らないという事実を指すことがよくあります。 半構造化データや非構造化データも存在する可能性があります。 Azure Synapse は、ビッグ データによく使用される Spark を使用したエンタープライズ データ ウェアハウジングで使用される最高の SQL テクノロジを統合しているため、この分野で威力を発揮します。
- 速度: 古いデータ アーキテクチャでよく見られる問題は、ストレージ容量、分析速度、取り込み速度の相互依存性です。 Azure データ ソリューションでは、組織はプラットフォームのさまざまなディメンションを分離することで、それらを個別にスケーリングできます。 エンタープライズ ビジネス インテリジェンス アーキテクチャに示されているように、必要な Azure データ サービスを使用するデータ パイプラインを使用して、データの取り込み、処理、および共有を行うことができます。
データ ガバナンス
今日の世界では、データは重要な資産と大きな責任の両方を表しています。 格納されたデータには、多くの場合、漏洩または不適切に共有された場合に経済的または個人的な損害をもたらす可能性のある機密情報が含まれています。 データの格納と処理は、組織がその責任を受け入れることを暗黙的に意味します。 法規制により、個人データや機密データを誤って処理した組織には、罰則が科せられる可能性があります。
結果として、データ管理は、データの民主化を目標とする組織にとって重要です。 データ管理に向けた最初のステップは、特定の方法で処理する必要があるデータを分類することです。 例として、Microsoft では、次のデータ カテゴリをデータ分類のために内部的に使用しています。
- ビジネス以外: Microsoft に属していない私生活のデータ。
- パブリック: 自由に利用でき、公開することが承認されているビジネス データ。
- 全般: 一般の人々を対象としていないビジネス データ。
- 機密: 過剰に共有された場合に Microsoft に損害を与える可能性のあるビジネス データ。
- 極秘: 過剰に共有された場合に Microsoft に広範な損害を与える可能性のあるビジネス データ。
データ分類の後の次の手順では、各データ カテゴリが不正アクセスから保護されていることを確認します。 Azure は、機密性を適用する次のテクノロジをサポートしています。
- 保存データの暗号化: すべての Azure データは、Microsoft データ センターに格納されるときに暗号化されます。 一部の Azure サービスには、Azure Synapse や Azure SQL Database の Transparent Data Encryption など、特定の暗号化機能が用意されています。
- インフライト データの暗号化: すべての Azure データ サービスでは、ネットワーク経由で送信する前に、データを TLS または SSL で暗号化します。 Azure Storage などの一部のサービスでは、必要に応じて暗号化されていないトラフィックを許可できます。 機密データの種類によっては、暗号化されていない通信を無効にする必要があります。
- データ アクセス制御: Azure プラットフォームにアクセスしたり、データ自体にアクセスしたりするための高度な認証と承認のメカニズムが Azure に用意されています。 Azure ロールベースのアクセス制御、条件付きアクセス、Privileged Identity Management は、認可された人のみが機密情報にアクセスできるようにするための重要なサービスの 3 つの例です。
- データ監査: 多くの規制コンプライアンス標準では、特定の操作を実行したり特定のデータにアクセスしたりしたユーザーを記録することによる、データ保護メカニズムの証拠が求められます。 「Azure SQL Database および Azure Synapse Analytics の監査」で説明したように、Azureでのデータ監査では、監査の 3 つの側面が考慮されます。
- 選択したイベントの監査証跡を保持します。ここでは、監査対象のデータ アクションのカテゴリを定義できます。
- データベースの利用状況を "レポート" します。必要に応じて、事前に構成されたレポートとダッシュボードを使用してすぐに作業を開始できます。
- レポートを "分析" して、疑わしいイベント、異常なアクティビティ、傾向を明らかにする
グロース マインドセット
学習フェーズでは、悪い知らせが提供されることがあります。 正しいと思っていた仮説が間違っていることがわかる場合があります。 イノベーション プロセスをスムーズに進めるには、代替案を受け入れることが重要です。 仮説全体が間違っていたのかもしれませんし、問題がプロトタイプの開発方法のみだったのかもしれません。
どのような場合でも、結論は常にデータに裏付けられている必要があります。 チームは、次の仮説 (場合によっては、最初の仮説の修正または反復) の策定に進む必要があります。
既存のデータでは、仮説が正しいか間違っているかを明確に結論付けることができない可能性があります。 この場合、意思決定プロセスに役立つデータセットを強化する必要があります。 アプリケーションに新しいテレメトリ ポイントを導入するか、カスタマー エクスペリエンスに関する情報を取得する新しい方法を検討します。
この段階では、成長型思考が基本です。 間違っている、または部分的に間違っていることが証明された仮説は、学習の機会と考えてください。 組織は、期待されるビジネス成果を生み出さないイノベーションに時間を浪費してはなりません。
次に見る部分
このユニットの概念の多くについては、データの民主化に関するクラウド導入フレームワークのドキュメントでさらに説明します。