Documentazione di Azure HDInsight
Azure HDInsight è un servizio Apache Hadoop gestito che consente di eseguire Apache Spark, Apache Hive, Apache Kafka, Apache HBase e altro ancora nel cloud.
Informazioni su HDInsight
Panoramica
Introduzione
Apache Spark
Introduzione
- Che cos'è Apache Spark?
- Creare cluster Spark ed eseguire Spark in Jupyter
- Caricare i dati ed eseguire query in Spark
Guida pratica
Apache Hadoop
Introduzione
- Che cos'è Apache Hadoop?
- Creare cluster Hadoop ed eseguire query Hive
- Eseguire gli esempi di MapReduce
Guida pratica
Integrazione
Guida pratica
- Spark/Hive - Connettere Spark e Hive con Hive Warehouse Connector
- Spark/Kafka - Streaming strutturato di Apache Spark con Apache Kafka
- Spark/HBase - Eseguire su Apache HBase con Apache Spark
- Creare cluster su richiesta con il file di definizione dell'applicazione (ADF)
Concetto
Apache Kafka
Introduzione
- Che cos'è Apache Kafka?
- Creare cluster Kafka e gestire gli argomenti Kafka
- Usare API per producer e consumer