Opis strumieni danych

Ukończone

Strumień danych składa się z bezterminowej serii danych, zwykle związanych z określonymi zdarzeniami punkt-w czasie. Na przykład strumień danych może zawierać szczegóły wiadomości przesłanych do witryny mikroblogowania mediów społecznościowych lub serię pomiarów środowiskowych zarejestrowanych przez czujnik pogody połączony z Internetem. Analiza danych przesyłanych strumieniowo jest najczęściej używana do lepszego zrozumienia zmian w czasie. Na przykład organizacja marketingowa może przeprowadzać analizę tonacji w wiadomościach w mediach społecznościowych, aby sprawdzić, czy kampania reklamowa powoduje bardziej pozytywne komentarze na temat firmy lub jej produktów, albo firma rolnicza może monitorować trendy temperatury i opadów, aby zoptymalizować nawadnianie i zbiory upraw.

Typowe cele dotyczące usługi Stream Analytics obejmują

  • Ciągłe analizowanie danych w celu zgłaszania problemów lub trendów.
  • Zrozumienie zachowania składnika lub systemu w różnych warunkach w celu zaplanowania przyszłych ulepszeń.
  • Wyzwalanie określonych akcji lub alertów w przypadku przekroczenia określonych zdarzeń lub progów.

Charakterystyka rozwiązań do przetwarzania strumieniowego

Rozwiązania do przetwarzania strumieniowego zwykle mają następujące cechy:

Diagram przedstawiający strumień danych, w tym przetwarzane pole daty i godziny, agregowane według dnia oraz wizualizowane i przechowywane.

  1. Strumień danych źródłowych jest niezwiązany — dane są dodawane do strumienia w sposób ciągły.
  2. Każdy rekord danych w strumieniu zawiera dane czasowe (oparte na czasie) wskazujące, kiedy wystąpiło zdarzenie, do którego odnosi się rekord (lub został zarejestrowany).
  3. Agregacja danych przesyłanych strumieniowo jest wykonywana w oknach czasowych — na przykład rejestrowanie liczby wpisów w mediach społecznościowych na minutę lub średnie opady na godzinę.
  4. Wyniki przetwarzania danych przesyłanych strumieniowo mogą służyć do obsługi automatyzacji lub wizualizacji w czasie rzeczywistym w czasie rzeczywistym albo utrwalania w magazynie analitycznym w celu połączenia z innymi danymi na potrzeby analizy historycznej. Wiele rozwiązań łączy te podejścia w celu obsługi analizy w czasie rzeczywistym i analizy historycznej.