Udostępnij za pośrednictwem


Przetwarzanie danych zdarzeń za pomocą edytora procesora zdarzeń

Edytor procesora zdarzeń to środowisko bez kodu, które umożliwia przeciąganie i upuszczanie w celu zaprojektowania logiki przetwarzania danych zdarzeń. W tym artykule opisano sposób projektowania logiki przetwarzania za pomocą edytora.

Uwaga

Rozszerzone możliwości są domyślnie włączone podczas tworzenia strumieni zdarzeń. Jeśli masz strumienie zdarzeń utworzone przy użyciu standardowych możliwości, te strumienie zdarzeń będą nadal działać. Nadal możesz edytować i używać ich jak zwykle. Zalecamy utworzenie nowego strumienia zdarzeń w celu zastąpienia standardowych strumieni zdarzeń, dzięki czemu można korzystać z dodatkowych możliwości i korzyści z rozszerzonych strumieni zdarzeń.

Wymagania wstępne

Przed rozpoczęciem należy spełnić następujące wymagania wstępne:

  • Dostęp do obszaru roboczego w trybie licencji pojemności Fabric lub w trybie licencji próbnej z uprawnieniami współautora lub wyższymi.

Projektowanie przetwarzania zdarzeń za pomocą edytora

Aby wykonać operacje przetwarzania strumieniowego na strumieniach danych przy użyciu edytora bez kodu, wykonaj następujące kroki:

  1. Wybierz pozycję Edytuj na wstążce, jeśli nie jesteś jeszcze w trybie edycji. Upewnij się, że węzeł nadrzędny dla połączonych operacji ma schemat.

    Zrzut ekranu przedstawiający edytor procesora zdarzeń w trybie edycji.

  2. Aby wstawić operator przetwarzania zdarzeń między węzłem strumienia i miejscem docelowym w trybie edycji, można użyć jednej z następujących dwóch metod:

    • Wstaw operator bezpośrednio z linii połączenia. Najedź kursorem na linię połączenia, a następnie wybierz przycisk +. Menu rozwijane pojawia się na linii połączenia, a z tego menu można wybrać operatora.

      Zrzut ekranu przedstawiający wybór przycisku + na linii połączenia.

    • Wstaw operator z menu wstążki lub kanwy.

      1. Możesz wybrać operator z menu Przekształć zdarzenia na wstążce.

        Zrzut ekranu przedstawiający zaznaczenie opcji Zarządzaj polami na wstążce.

        Alternatywnie możesz najechać kursorem na jeden z węzłów, a następnie wybrać przycisk +, jeśli linia połączenia została usunięta. Obok tego węzła pojawi się menu rozwijane, z którego możesz wybrać operatora.

        Zrzut ekranu przedstawiający wybór linku „plus” na linii połączenia.

      2. Po wstawieniu operatora należy ponownie połączyć te węzły. Umieść kursor na lewej krawędzi węzła strumienia, a następnie wybierz i przeciągnij zielony okrąg, aby połączyć go z węzłem operatora Zarządzaj polami . Wykonaj ten sam proces, aby połączyć węzeł operatora Zarządzaj polami z miejscem docelowym.

        Zrzut ekranu przedstawiający sposób łączenia kafelka Zarządzanie polami.

  3. Wybierz węzeł Operator Zarządzaj polami. W panelu Zarządzanie polami wybierz pola, które chcesz wyświetlić. Jeśli chcesz dodać wszystkie pola, wybierz pozycję Dodaj wszystkie pola. Możesz również dodać nowe pole z wbudowanymi funkcjami, aby agregować dane ze strumienia źródłowego. (Obecnie funkcje wbudowane, które obsługujemy, to niektóre funkcje w funkcjach ciągów, funkcjach daty i godziny, funkcjach matematycznych. Aby je znaleźć, wyszukaj ciąg built-in.)

    Zrzut ekranu przedstawiający sposób konfigurowania kafelka Zarządzanie polami.

  4. Po skonfigurowaniu operatora Zarządzanie polami wybierz pozycję Odśwież , aby zweryfikować wynik testu wygenerowany przez ten operator.

    Zrzut ekranu przedstawiający odświeżaną stronę.

  5. Jeśli występują błędy konfiguracji, są one wyświetlane na karcie Błędy autorstwa w dolnym okienku.

    Zrzut ekranu przedstawiający kartę Błędy tworzenia.

  6. Jeśli wynik testu wygląda poprawnie, wybierz pozycję Publikuj , aby zapisać logikę przetwarzania zdarzeń i wrócić do widoku na żywo.

    Zrzut ekranu przedstawiający przycisk Publikuj na wybranej wstążce.

  7. Po wykonaniu tych kroków możesz zobaczyć, jak twój strumień zdarzeń rozpoczyna przesyłanie i przetwarzanie danych w widoku na żywo.

    Zrzut ekranu przedstawiający widok na żywo.

Edytor przetwarzania zdarzeń

Edytor procesora zdarzeń (kanwa w trybie edycji) umożliwia przekształcanie danych w różne miejsca docelowe. Wprowadź Tryb edycji, aby zaprojektować operacje przetwarzania strumieniowego dla strumieni danych.

Zrzut ekranu przedstawiający edytor przetwarzania zdarzeń dla strumienia zdarzeń z rozszerzonymi możliwościami.

Tryb edycji zawiera kanwę i dolne okienko, w którym można wykonywać następujące czynności:

  • Utwórz logikę transformacji danych zdarzeń za pomocą przeciągania i upuszczania.
  • Podgląd wyniku testu w każdym z węzłów przetwarzania od początku do końca.
  • Odnajdź wszelkie błędy tworzenia w węzłach przetwarzania.

Układ edytora

Zrzut ekranu przedstawiający układ edytora przetwarzania zdarzeń dla strumienia zdarzeń z rozszerzonymi możliwościami.

  • Menu wstążki i Kanwa (oznaczone jako numer jeden na obrazie): W tym okienku możesz zaprojektować logikę przekształcania danych, wybierając operator (z menu Transformuj zdarzenia) i łącząc strumień oraz węzły docelowe przez nowo utworzony węzeł operatora. Możesz przeciągać i upuszczać linie łączące lub wybierać i usuwać połączenia.
  • Okienko edycji po prawej stronie (dwa na obrazie): to okienko umożliwia skonfigurowanie wybranego węzła lub nazwy strumienia widoku.
  • Dolne okienko z kartami podglądu danych i błędów tworzenia (trzy na obrazie): W tym okienku można wyświetlić podgląd wyniku testu w wybranym węźle na karcie Wynik testu. Karta Błędy tworzenia zawiera wszystkie niekompletne lub nieprawidłowe konfiguracje w węzłach operacji.

Obsługiwane typy węzłów i przykłady

Poniżej przedstawiono typy docelowe, które obsługują dodawanie operatorów przed przetwarzaniem:

  • Lakehouse
  • Eventhouse (Przetwarzanie zdarzeń przed przetwarzaniem)
  • Strumień pochodny
  • Aktywator

Uwaga

W przypadku miejsc docelowych, które nie obsługują dodawania operatora pozyskiwania wstępnego, możesz najpierw dodać strumień pochodny jako dane wyjściowe operatora. Następnie dołącz zamierzone miejsce docelowe do tego wynikowego strumienia.

Zrzut ekranu przedstawiający układ edytora przetwarzania zdarzeń z filtrem wyjściowym do nieobsługiwanego miejsca docelowego.

Procesor zdarzeń w usłudze Lakehouse i bazie danych KQL (przetwarzanie zdarzeń przed pozyskiwaniem) umożliwia przetwarzanie danych przed ich pozyskaniem do miejsca docelowego.

Wymagania wstępne

Przed rozpoczęciem należy spełnić następujące wymagania wstępne:

  • Dostęp do obszaru roboczego w trybie licencji Fabric capacity lub w trybie licencji próbnej z uprawnieniami współautora lub wyższe.
  • Uzyskaj dostęp do obszaru roboczego z uprawnieniami współautora lub wyższymi uprawnieniami, w których znajduje się baza danych lakehouse lub KQL.

Projektowanie przetwarzania zdarzeń za pomocą edytora

Aby zaprojektować przetwarzanie zdarzeń za pomocą edytora procesora zdarzeń:

  1. Dodaj przeznaczenie Lakehouse i wprowadź niezbędne parametry w okienku po prawej stronie. (Zobacz Dodaj i zarządzaj lokalizacją docelową w strumieniu zdarzeń, aby uzyskać szczegółowe instrukcje.)

  2. Wybierz Procesor zdarzeń Otwarty. Na ekranie pojawia się Edytor przetwarzania zdarzeń.

    Zrzut ekranu przedstawiający, gdzie wybrać pozycję Otwórz procesor zdarzeń na ekranie konfiguracji docelowej usługi Lakehouse.

  3. Na kanwie edytora przetwarzania zdarzeń wybierz węzeł eventstream. Możesz wyświetlić podgląd schematu danych lub zmienić typ danych w prawym okienku Strumienia zdarzeń .

    Zrzut ekranu przedstawiający schemat danych w okienku po prawej stronie ekranu edytora przetwarzania zdarzeń.

  4. Aby wstawić operator przetwarzania zdarzeń między tym strumieniem zdarzeń a miejscem docelowym w edytorze procesora zdarzeń, można użyć jednej z następujących dwóch metod:

    1. Wstaw operator bezpośrednio z linii połączenia. Zatrzymaj wskaźnik myszy na wierszu połączenia, a następnie wybierz przycisk "+". Menu rozwijane pojawia się na linii połączenia i można wybrać operatora z tego menu.

      Zrzut ekranu przedstawiający, gdzie najedź kursorem na linii połączenia, aby wstawić węzeł.

    2. Wstaw operator z menu wstążki lub widoku.

      1. Możesz wybrać operator z menu Operacje na wstążce. Alternatywnie możesz zatrzymać wskaźnik myszy na jednym z węzłów, a następnie wybrać przycisk "+", jeśli wiersz połączenia został usunięty. Obok tego węzła pojawi się menu rozwijane, z którego możesz wybrać operatora.

        Zrzut ekranu przedstawiający miejsce wybierania operatora z menu Operacje.

        Zrzut ekranu pokazujący miejsce, gdzie należy najechać kursorem na węzły, aby wstawić węzeł.

      2. Na koniec należy ponownie połączyć te węzły. Umieść kursor na lewej krawędzi węzła strumienia zdarzeń, a następnie wybierz i przeciągnij zielony okrąg, aby połączyć go z węzłem operatora Zarządzaj polami . Postępuj zgodnie z tym samym procesem, aby połączyć węzeł operatora zarządzaj polami z węzłem lakehouse.

        Zrzut ekranu przedstawiający miejsce łączenia węzłów.

  5. Wybierz węzeł operatora Zarządzaj polami. W panelu Zarządzanie polami wybierz pola, które chcesz wyświetlić. Jeśli chcesz dodać wszystkie pola, wybierz pozycję Dodaj wszystkie pola. Możesz również dodać nowe pole z wbudowanymi funkcjami, aby agregować dane ze źródła. (Obecnie funkcje wbudowane, które obsługujemy, to niektóre funkcje w programie Funkcje ciągów, funkcje daty i godziny, funkcje matematyczne. Aby je znaleźć, wyszukaj frazę "wbudowane".

    Zrzut ekranu przedstawiający sposób konfigurowania operatora.

  6. Po skonfigurowaniu operatora Zarządzanie polami wybierz pozycję Odśwież statyczną wersję zapoznawcza , aby wyświetlić podgląd danych generowanych przez tego operatora.

    Zrzut ekranu przedstawiający sposób wyświetlania podglądu danych w edytorze procesora zdarzeń.

  7. Jeśli występują błędy konfiguracji, są one wyświetlane na karcie Błędy autorskie w dolnym okienku.

    Zrzut ekranu przedstawiający kartę błędu tworzenia treści w edytorze procesora zdarzeń.

  8. Jeśli podgląd danych wygląda poprawnie, wybierz pozycję Gotowe , aby zapisać logikę przetwarzania zdarzeń i wrócić do ekranu konfiguracji docelowej usługi Lakehouse.

  9. Wybierz pozycję Dodaj , aby ukończyć tworzenie miejsca docelowego usługi Lakehouse.

Edytor procesora zdarzeń

Procesor zdarzeń umożliwia przekształcanie danych, które są pozyskiwane do miejsca docelowego usługi Lakehouse. Po skonfigurowaniu miejsca docelowego Lakehouse, opcja Otwórz procesor zdarzeń znajduje się w środku ekranu konfiguracji miejsca docelowego Lakehouse.

Zrzut ekranu przedstawiający miejsce otwierania edytora procesora zdarzeń.

Wybranie pozycji Otwórz procesor zdarzeń uruchamia ekran edytora przetwarzania zdarzeń, na którym można zdefiniować logikę przekształcania danych.

Edytor procesora zdarzeń zawiera kanwę i dolne okienko, w którym można:

  • Skompiluj logikę przekształcania danych zdarzeń za pomocą przeciągania i upuszczania.
  • Wyświetl podgląd danych w każdym z węzłów przetwarzania od początku do końca.
  • Odnajdź wszelkie błędy tworzenia w węzłach przetwarzania.

Układ ekranu jest podobny do głównego edytora. Składa się z trzech sekcji pokazanych na poniższej ilustracji:

Zrzut ekranu edytora przetwarzania zdarzeń wskazujący trzy główne sekcje.

  1. Kanwa z widokiem diagramu: w tym okienku możesz zaprojektować logikę przekształcania danych, wybierając operator (z menu Operacje ) i łącząc strumień zdarzeń i węzły docelowe za pośrednictwem nowo utworzonego węzła operatora. Możesz przeciągać i upuszczać linie łączące lub wybierać i usuwać połączenia.

  2. Okienko edycji po prawej stronie: to okienko umożliwia skonfigurowanie wybranego węzła operacji lub wyświetlenie schematu strumienia zdarzeń i miejsca docelowego.

  3. Dolne okienko z kartami podglądu danych i błędami redagowania: W tym okienku na karcie Podgląd danych możesz wyświetlić podgląd danych w wybranym węźle. Karta Błędy redagowania zawiera wszelkie niekompletne lub nieprawidłowe konfiguracje w węzłach operacji.

Błędy tworzenia

pl-PL: Błędy w tworzeniu odnoszą się do błędów występujących w edytorze procesora zdarzeń z powodu niekompletnej lub nieprawidłowej konfiguracji węzłów operacyjnych, które pomagają znaleźć i rozwiązać potencjalne problemy w procesorze zdarzeń.

Możesz wyświetlać błędy związane z tworzeniem w dolnym panelu edytora procesora zdarzeń. Na dolnym panelu wymieniono wszystkie błędy tworzenia. Każdy błąd tworzenia zawiera cztery kolumny:

  • Identyfikator węzła: wskazuje identyfikator węzła operacji, gdzie wystąpił błąd autorski.
  • Typ węzła: Wskazuje typ węzła operacji, w którym wystąpił błąd autorski.
  • Poziom: wskazuje ważność błędu tworzenia, istnieją dwa poziomy: Krytyczny i Informacyjny. Błąd tworzenia na poziomie krytycznym oznacza, że procesor zdarzeń ma poważne problemy i nie można go zapisać ani uruchomić. Błąd tworzenia na poziomie informacji oznacza, że procesor zdarzeń zawiera wskazówki lub sugestie, które mogą pomóc w optymalizacji lub ulepszaniu procesora zdarzeń.
  • Błąd: wskazuje konkretne informacje o błędzie tworzenia, krótko opisując przyczynę i wpływ błędu tworzenia. Możesz wybrać kartę Pokaż szczegóły , aby wyświetlić szczegóły.

Ponieważ usługa Eventstream i Eventhouse obsługują różne typy danych, proces konwersji typu danych może generować błędy tworzenia.

W poniższej tabeli przedstawiono wyniki konwersji typu danych z eventstream na Eventhouse. Kolumny reprezentują typy danych obsługiwane przez strumień zdarzeń, a wiersze reprezentują typy danych obsługiwane przez usługę Eventhouse. Komórki wskazują wyniki konwersji, które mogą być jednym z następujących trzech:

✔️ Wskazuje pomyślną konwersję, nie są generowane żadne błędy ani ostrzeżenia.

❌ Wskazuje niemożliwą konwersję, generowany jest błąd krytyczny podczas tworzenia. Komunikat o błędzie jest podobny do: Typ danych "{1}" dla kolumny "{0}" nie jest zgodny z oczekiwanym typem "{2}" w wybranej tabeli KQL i nie można go automatycznie rozpoznać.

⚠️ Wskazuje możliwą, ale niedokładną konwersję, generowany jest błąd przy tworzeniu informacji. Komunikat o błędzie jest podobny do: Typ danych "{1}" dla kolumny "{0}" nie jest dokładnie zgodny z oczekiwanym typem "{2}" w wybranej tabeli KQL. Jest automatycznie konwertowana na "{2}".

string bool data i czas dynamiczna Identyfikator GUID int długi rzeczywiste zakres czasu dziesiętny
Int64 ✔️ ⚠️ ✔️ ⚠️ ✔️
Podwójne ✔️ ⚠️ ⚠️
ciąg ✔️ ✔️
Data i godzina ⚠️ ✔️ ✔️
Nagraj ⚠️ ✔️
Tablica ⚠️ ✔️

Jak widać w tabeli, niektóre konwersje typów danych są pomyślne, takie jak konwersja ciągu znaków do ciągu znaków. Te konwersje nie generują żadnych błędów tworzenia i nie mają wpływu na działanie procesora zdarzeń.

Niektóre konwersje typów danych są niemożliwe, takie jak int do ciągu. Te konwersje generują błędy tworzenia na poziomie krytycznym, co powoduje niepowodzenie zapisywania procesora zdarzeń. Aby uniknąć tych błędów, musisz zmienić typ danych w strumieniu zdarzeń lub w tabeli KQL.

Niektóre konwersje typów danych są możliwe, ale nie są precyzyjne, takie jak int do rzeczywistego. Te konwersje generują błędy tworzenia na poziomie informacji, wskazujące niezgodność między typami danych i wyniki automatycznej konwersji. Te konwersje mogą spowodować utratę dokładności lub struktury danych. Możesz wybrać, czy zignorować te błędy, czy zmodyfikować typ danych w strumieniu zdarzeń lub w tabeli KQL, aby zoptymalizować procesor zdarzeń.

Operatory przekształcania

Procesor zdarzeń udostępnia siedem operatorów, których można użyć do przekształcania danych zdarzeń zgodnie z potrzebami biznesowymi.

Zrzut ekranu przedstawiający operatory dostępne w menu Operacje.

Agregacja

Użyj przekształcenia Agregacja, aby obliczyć agregację (Suma, Minimum, Maksimum lub Średnia) za każdym razem, gdy nowe zdarzenie występuje w danym okresie. Ta operacja umożliwia również zmianę nazw tych kolumn obliczeniowych oraz filtrowanie lub fragmentowanie agregacji na podstawie innych wymiarów w danych. W tej samej transformacji można mieć co najmniej jedną agregację.

  • Nazwa operatora: określ nazwę operacji agregacji.
  • Dodaj funkcję agregującą: dodaj co najmniej jedną funkcję agregującą w ramach operacji agregacji.
  • Typ: wybierz typ agregacji: Suma, Minimum, Maksimum lub Średnia.
  • Pole: wybierz kolumnę do przetworzenia.
  • Nazwa: zdefiniuj nazwę dla tej funkcji agregacji.
  • Partycjonowanie według: wybierz kolumnę, aby zgrupować agregację.
  • Zagregowane wartości w ciągu ostatnich: określ przedział czasu dla agregacji (domyślnie to 5 sekund).

Zrzut ekranu przedstawiający konfigurację i wynik testu operatora agregacji.

Rozwiń

Użyj przekształcenia Expand, aby utworzyć nowy wiersz dla każdej wartości w tablicy. Możesz wybrać pozycję Utwórz wiersz dla brakującej/pustej tablicy lub nie utworzyć wiersza dla brakującej/pustej tablicy.

Zrzut ekranu przedstawiający konfigurację i wynik testu operatora rozszerzenia.

Filtr

Użyj przekształcenia filtru, aby filtrować zdarzenia na podstawie wartości pola w danych wejściowych. W zależności od typu danych (liczby lub tekstu) przekształcenie zachowuje wartości zgodne z wybranym warunkiem, na przykład ma wartość null lub nie ma wartości null.

Grupuj według

Użyj przekształcenia Grupa według, aby obliczyć agregacje we wszystkich zdarzeniach w określonym przedziale czasu. Można grupować według wartości w co najmniej jednym polu. Jest to tak, jakby przekształcenie Agregacja pozwalało na zmianę nazw kolumn, ale oferowało więcej opcji agregacji i bardziej złożone opcje dla okien czasowych. Podobnie jak agregacja, można dodać więcej niż jedną agregację na transformację.

Agregacje dostępne w transformacji to:

  • Średnia
  • Liczba
  • Maksimum
  • Minimum
  • Percentyl (ciągły i dyskretny)
  • Odchylenie standardowe
  • Suma
  • Wariancja

W scenariuszach przesyłania strumieniowego czasu wykonywanie operacji na danych zawartych w oknach czasowych jest typowym wzorcem. Procesor zdarzeń obsługuje funkcje okienkowe, które są zintegrowane z operatorem Group by. Można go zdefiniować w ustawieniu tego operatora.

Zrzut ekranu przedstawiający operator Grupowanie według dostępny w edytorze procesora zdarzeń.

Zarządzanie polami

Przekształcenie Zarządzaj polami umożliwia dodawanie, usuwanie, zmienianie typu danych lub zmienianie nazwy pól przychodzących z danych wejściowych lub innej transformacji. Ustawienia okienka bocznego umożliwiają dodawanie nowego pola, wybierając pozycję Dodaj pole, dodając wiele pól lub dodając jednocześnie wszystkie pola.

Zrzut ekranu przedstawiający operator Zarządzanie polami dostępny w edytorze procesora zdarzeń.

Ponadto można dodać nowe pole za pomocą wbudowanych funkcji, aby agregować dane ze źródła. (Obecnie funkcje wbudowane, które obsługujemy, to niektóre funkcje w programie Funkcje ciągów, funkcje daty i godziny oraz funkcje matematyczne. Aby je znaleźć, wyszukaj frazę "wbudowane".

Zrzut ekranu przedstawiający wbudowane funkcje zarządzania polami.

W poniższej tabeli przedstawiono wyniki zmiany typu danych przy użyciu pól zarządzania. Kolumny reprezentują oryginalne typy danych, a wiersze reprezentują docelowy typ danych.

  • Jeśli w komórce jest symbol ✔️, oznacza to, że można go przekonwertować bezpośrednio, a docelowy typ danych jest wyświetlany na liście rozwijanej.
  • Jeśli w komórce znajduje się ❌, oznacza to, że nie można jej przekonwertować, a opcja docelowego typu danych nie jest wyświetlana na liście rozwijanej.
  • Jeśli w komórce znajduje się ⚠, oznacza to, że można ją przekonwertować, ale musi spełniać określone warunki, takie jak zgodność formatu ciągu z wymaganiami docelowego typu danych. Na przykład podczas konwertowania z ciągu na int, ciąg musi być prawidłową liczbą całkowitą, taką jak 123, a nie abc.
Int64 Podwójny String Data i czas Nagraj Tablica
Int64 ✔️ ✔️ ✔️
Podwójne ✔️ ✔️ ✔️
łańcuch znaków ⚠️ ⚠️ ✔️ ⚠️
Data i godzina ✔️ ✔️
Nagraj ✔️ ✔️
Tablica ✔️ ✔️

Unia

Użyj przekształcenia Unii, aby połączyć co najmniej dwa węzły i dodać zdarzenia, które mają współużytkowane pola (jeśli mają taką samą nazwę i typ danych), do jednej tabeli. Pola, które nie są zgodne, są porzucane i nie są uwzględniane w danych wyjściowych.

Dołączanie

Użyj przekształcenia Join, aby połączyć zdarzenia z dwóch danych wejściowych na podstawie wybranych par pól. Jeśli nie wybierzesz pary pól, połączenie jest domyślnie oparte na czasie. Wartością domyślną jest to, co sprawia, że ta transformacja różni się od tej wsadowej.

Podobnie jak w przypadku zwykłych sprzężeń, masz opcje logiki sprzężenia:

  • Sprzężenie wewnętrzne: uwzględniaj tylko rekordy z obu tabel, gdzie wartości obu pól są zgodne.
  • Połączenie zewnętrzne lewostronne: dołącz wszystkie rekordy z lewej (pierwszej) tabeli i tylko rekordy z drugiej, które pasują parą pól. Jeśli nie ma dopasowania, pola z drugiego wejścia są puste.