在 Azure HDInsight 中使用 Apache Spark 和 Kafka 执行高级流数据转换
在本模块中,你将了解如何通过将 Azure HDInsight 与 Apache Kafka 及 Apache Spark 结合,在云上创建实时流数据分析管道和应用程序。
学习目标
本模块结束后,你将了解:
- 何时结合使用 HDInsight 与 Apache Spark 及 Kafka。
- Spark 结构化流。
- Kafka 和 Spark 解决方案的体系结构。
- 如何预配 HDInsight,创建 Kafka 制作者以及如何将 Kafka 数据流式传输到 Jupyter 笔记本。
- 如何将数据复制到辅助群集。
先决条件
应满足以下先决条件:
- 成功登录到 Azure 门户。
- 了解 Azure 存储选项。
- 了解 Azure 计算选项。
- 在 Azure 门户中创建和配置 HDInsight 群集。