Introdução

Concluído

Muitas organizações hoje trabalham com big data. O enorme volume e variedade de dados e a velocidade de geração de dados exigem ter sistemas que o ajudem a gerenciá-los e controlá-los. No passado, as organizações usavam sistemas de gerenciamento de banco de dados relacional para controlar os dados. No entanto, as organizações agora querem a funcionalidade de software de código aberto combinada com os benefícios das plataformas hospedadas. O Azure HDInsight é o exemplo perfeito desta parceria. O HDInsight permite processar big data em muitos cenários usando dados históricos ou em tempo real.

O gráfico a seguir mostra uma visão geral de como você pode usar o HDInsight. Ele descreve várias fontes de dados, incluindo sensores de Internet das Coisas (IoT), bancos de dados e vários armazenamentos de dados do Azure. O HDInsight processa dados desses locais. Em seguida, disponibiliza-o em armazenamento de longo prazo para aplicações em tempo real e análise adicional.

Diagram of the architecture of HDInsight in a typical organization, depicting several data sources from which it manages big data.

Cenário de exemplo

Vamos imaginar que você trabalhe para uma organização que cria cargas de trabalho que ingerem dados para relatórios históricos e análises avançadas. Talvez você também tenha dados de streaming que exigem análise. Nessa situação, convém considerar o uso do HDInsight. Ele permite a ingestão de todos os dados em um único local do Data Lake. Em seguida, você pode usá-lo para gerenciar as seguintes cargas de trabalho:

  • Processamento em lotes
  • Armazenamento de dados
  • Operações de ciência de dados
  • Transmissão

O que vamos fazer?

Ao final deste módulo, você poderá avaliar se o HDInsight pode ajudar sua organização a processar big data. Você também poderá descrever como o HDInsight usa estruturas de código aberto populares que suportam muitos cenários de dados.

Qual é o principal objetivo?

O principal objetivo é determinar se o HDInsight é uma escolha adequada para seus requisitos de processamento de big data.