はじめに

完了

現在、多くの組織が "ビッグ データ" を扱っています。 膨大で多様なデータとデータ生成速度により、その管理と制御に役立つシステムが必要とされます。 組織は、これまでリレーショナル データベース管理システムを使用してデータを制御していました。 しかしながら、現在、組織はオープンソース ソフトウェアの機能とホストされたプラットフォームの利点を組み合わせたいと考えています。 この連携に最適な一例が Azure HDInsight です。 HDInsight では、履歴またはリアルタイムのデータを使って、さまざまなシナリオでビッグ データを処理できます。

次の図は、HDInsight の使用方法の概要を示しています。 モノのインターネット (IoT) センサー、データベース、いくつかの Azure データストアなど、複数のデータ ソースが示されています。 これらの場所のデータを HDInsight を使用して処理します。 リアルタイムのアプリや追加の分析用に長期的なストレージで使用できるようにします。

Diagram of the architecture of HDInsight in a typical organization, depicting several data sources from which it manages big data.

シナリオ例

あなたが働いている組織が、履歴レポートや高度な分析のためにデータを取り込むワークロードを構築します。 おそらく、分析が必要なストリーミング データもあります。 この状況には、HDInsight の使用を検討することをお勧めします。 すべてのデータを単一のデータ レイクの場所に取り込むことができます。 これを、次のワークロードを管理するために使用できます。

  • バッチ処理
  • データ ウェアハウス
  • データ サイエンス操作
  • ストリーミング

学習内容

このモジュールが終了すると、HDInsight がご自分の組織のビッグ データ処理に役立つかどうかを評価できるようになります。 また、HDInsight で、さまざまなデータ シナリオをサポートする広く普及しているオープンソース フレームワークを使用する方法を説明できるようになります。

主な目標

主な目的は、HDInsight がご自分のビッグ データ処理の要件に適した選択肢であるかどうかを判断することです。