Opis strumieni danych
Strumień danych składa się z bezterminowej serii danych, zwykle związanych z określonymi zdarzeniami punkt-w czasie. Na przykład strumień danych może zawierać szczegóły wiadomości przesłanych do witryny mikroblogowania mediów społecznościowych lub serię pomiarów środowiskowych zarejestrowanych przez czujnik pogody połączony z Internetem. Analiza danych przesyłanych strumieniowo jest najczęściej używana do lepszego zrozumienia zmian w czasie. Na przykład organizacja marketingowa może przeprowadzać analizę tonacji w wiadomościach w mediach społecznościowych, aby sprawdzić, czy kampania reklamowa powoduje bardziej pozytywne komentarze na temat firmy lub jej produktów, albo firma rolnicza może monitorować trendy temperatury i opadów, aby zoptymalizować nawadnianie i zbiory upraw.
Typowe cele dotyczące usługi Stream Analytics obejmują
- Ciągłe analizowanie danych w celu zgłaszania problemów lub trendów.
- Zrozumienie zachowania składnika lub systemu w różnych warunkach w celu zaplanowania przyszłych ulepszeń.
- Wyzwalanie określonych akcji lub alertów w przypadku przekroczenia określonych zdarzeń lub progów.
Charakterystyka rozwiązań do przetwarzania strumieniowego
Rozwiązania do przetwarzania strumieniowego zwykle mają następujące cechy:
- Strumień danych źródłowych jest niezwiązany — dane są dodawane do strumienia w sposób ciągły.
- Każdy rekord danych w strumieniu zawiera dane czasowe (oparte na czasie) wskazujące, kiedy wystąpiło zdarzenie, do którego odnosi się rekord (lub został zarejestrowany).
- Agregacja danych przesyłanych strumieniowo jest wykonywana w oknach czasowych — na przykład rejestrowanie liczby wpisów w mediach społecznościowych na minutę lub średnie opady na godzinę.
- Wyniki przetwarzania danych przesyłanych strumieniowo mogą służyć do obsługi automatyzacji lub wizualizacji w czasie rzeczywistym w czasie rzeczywistym albo utrwalania w magazynie analitycznym w celu połączenia z innymi danymi na potrzeby analizy historycznej. Wiele rozwiązań łączy te podejścia w celu obsługi analizy w czasie rzeczywistym i analizy historycznej.