Geavanceerde streaminggegevenstransformaties uitvoeren met Apache Spark en Kafka in Azure HDInsight
In deze module leert u hoe u realtime pijplijnen en toepassingen voor streaminggegevensanalyse in de cloud maakt met behulp van Azure HDInsight met Apache Kafka en Apache Spark.
Leerdoelen
Aan het einde van deze module begrijpt u het volgende:
- Wanneer gebruikt u Apache Spark en Kafka met HDInsight.
- Spark Structured Streaming.
- De architectuur van een Kafka- en Spark-oplossing.
- HdInsight inrichten, een Kafka-producent maken en Kafka-gegevens streamen naar een Jupyter-notebook.
- Gegevens repliceren naar een secundair cluster.
Vereisten
De volgende vereiste moet worden voltooid:
- Meld u aan bij Azure Portal.
- Inzicht in de Opties voor Azure Storage.
- Inzicht in de Azure-rekenopties.
- Maak en configureer een HDInsight-cluster in Azure Portal.