O que é análise de dados em tempo real?

Concluído

A análise de dados em tempo real é geralmente baseada na ingestão e processamento de um fluxo de dados que consiste em uma série perpétua de dados, normalmente relacionados a eventos point-in-time específicos. Por exemplo, um fluxo de dados pode conter detalhes de mensagens enviadas para um site de microblog de mídia social ou uma série de medições ambientais registradas por um sensor meteorológico conectado à Internet.

Os dados no fluxo podem ser usados para criar visualizações em tempo real dos dados para fins de monitoramento ou para acionar ações automatizadas se determinadas condições ocorrerem. Por exemplo, um fluxo de dados de um sensor de controle ambiental em um prédio de escritórios pode permitir que os sistemas de aquecimento e ar condicionado sejam controlados dinamicamente para otimizar o conforto e o custo. Os dados também podem ser persistidos em um armazenamento de dados e consultados posteriormente, permitindo que os analistas entendam melhor as mudanças ao longo do tempo. Por exemplo, uma organização de marketing pode realizar análises de sentimento em mensagens de mídia social para ver se uma campanha publicitária resulta em comentários mais positivos sobre a empresa ou seus produtos, ou uma empresa agrícola pode monitorar tendências de temperatura e precipitação para otimizar a irrigação e a colheita de colheitas.

Os objetivos comuns para análises em tempo real incluem:

  • Analisar continuamente os dados para relatar problemas ou tendências.
  • Compreender o comportamento do componente ou do sistema sob várias condições para ajudar a planejar aprimoramentos futuros.
  • Acionar ações ou alertas específicos quando determinados eventos ocorrem ou os limites são excedidos.

Características das soluções de análise de dados em tempo real

As soluções de processamento de fluxo para análise de dados em tempo real normalmente apresentam as seguintes características:

Diagrama mostrando um fluxo de dados sendo processados, agregados por dia e visualizados e armazenados.

  1. Um fluxo de dados é ilimitado - os dados são adicionados ao fluxo perpetuamente.
  2. Os registros de dados no fluxo geralmente incluem dados temporais (baseados no tempo) que indicam quando o evento ao qual o registro se refere ocorreu (ou foi gravado).
  3. A agregação de dados de streaming é frequentemente realizada em janelas temporais - por exemplo, registrando o número de postagens de mídia social por minuto ou a precipitação média por hora.
  4. Os resultados do processamento de dados de streaming podem ser usados para suportar automação ou visualização em tempo real (ou quase em tempo real), ou persistidos em um repositório analítico para serem combinados com outros dados para análise histórica. Muitas soluções combinam essas abordagens para oferecer suporte a análises históricas e em tempo real.

Os recursos de inteligência em tempo real do Microsoft Fabric permitem implementar soluções de análise em tempo real que incluem os recursos descritos aqui com esforço mínimo (ou nenhum) de codificação e integração com o restante do ecossistema do Microsoft Fabric.