Azure HDInsight で Apache Spark と Kafka を使用して高度なストリーミングデータ変換を実行する

中級

データエンジニア

データサイエンティスト

Azure HDInsight

このモジュールでは、Azure HDInsight を Apache Kafka と Apache Spark と合わせて使用することで、クラウド上にリアルタイムのストリーミングデータ分析パイプラインとアプリケーションを作成する方法を学習します。

学習の目的

このモジュールを完了すると、次のことを理解できます。

HDInsight で Apache Spark と Kafka を使うべきとき。
Spark の構造化ストリーミング。
Kafka と Spark ソリューションのアーキテクチャ。
HDInsight をプロビジョニングし、Kafka プロデューサーを作成して、Kafka データを Jupyter Notebook にストリーム配信する方法。
データをセカンダリクラスターにレプリケートする方法。

次の前提条件を完了する必要があります。