Criar Soluções de Análise para Software Open Source (OSS) com o Azure HDInsight

Intermédio
Data Engineer
Data Scientist
Azure HDInsight

Neste percurso de aprendizagem, o aluno é apresentado ao HDInsight e como aplicar esta tecnologia para resolver uma série de desafios do mundo real.

Pré-requisitos

Os seguintes pré-requisitos devem ser concluídos

  • Iniciar sessão com êxito no portal do Azure
  • Compreender as opções de armazenamento do Azure
  • Compreender as opções de computação do Azure

Módulos neste percurso de aprendizagem

No final deste módulo, você aprenderá que o Azure HDInsight é um serviço de nuvem totalmente gerenciado que permite processar com eficiência grandes quantidades de dados usando as estruturas de código aberto mais populares.

Neste módulo, você aprenderá as diferentes configurações para garantir o uso ideal do HDInsight do ponto de vista do desempenho e do custo.

Neste módulo, você aprenderá a criar um Cluster HDInsight, monitorar um cluster e estar ciente de problemas comuns de provisionamento.

Saiba como o HBase fornece acesso aleatório e forte consistência para grandes quantidades de dados não estruturados e semiestruturados em um banco de dados sem esquema organizado por famílias de colunas.

Neste módulo, você aprenderá a criar pipelines e aplicativos de análise de dados de streaming em tempo real na nuvem usando o Azure HDInsight com Apache Kafka e Apache Spark.

Ao final deste módulo, você pode executar consultas ad hoc em um conjunto de big data. O uso da Consulta Interativa do HDInsight ajuda a obter latências de consulta inferiores a um segundo.

O Azure HDInsight com outros serviços do Azure fornece uma solução de segurança abrangente de várias camadas e é uma responsabilidade compartilhada entre a Microsoft e o cliente.