Samouczek: wykrywanie anomalii za pomocą usług Azure AI
Z tego samouczka dowiesz się, jak łatwo wzbogacić dane w usłudze Azure Synapse Analytics za pomocą usług Azure AI. Aby znaleźć anomalie, użyjesz Narzędzie do wykrywania anomalii usługi Azure AI. Użytkownik w usłudze Azure Synapse może po prostu wybrać tabelę, aby wzbogacić ją o wykrywanie anomalii.
W tym samouczku opisano następujące czynności:
- Kroki pobierania zestawu danych tabeli Spark zawierającego dane szeregów czasowych.
- Korzystanie z środowiska kreatora w usłudze Azure Synapse w celu wzbogacania danych przy użyciu Narzędzie do wykrywania anomalii.
Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Wymagania wstępne
- Obszar roboczy usługi Azure Synapse Analytics z kontem magazynu usługi Azure Data Lake Storage Gen2 skonfigurowanym jako magazyn domyślny. Musisz być współautorem danych obiektu blob usługi Storage w systemie plików usługi Data Lake Storage Gen2, z którym pracujesz.
- Pula platformy Spark w obszarze roboczym usługi Azure Synapse Analytics. Aby uzyskać szczegółowe informacje, zobacz Tworzenie puli Spark w usłudze Azure Synapse.
- Ukończenie kroków wstępnej konfiguracji w samouczku Konfigurowanie usług AI platformy Azure w usłudze Azure Synapse .
Zaloguj się do witryny Azure Portal.
Zaloguj się w witrynie Azure Portal.
Tworzenie tabeli platformy Spark
Na potrzeby tego samouczka potrzebujesz tabeli Platformy Spark.
Utwórz notes PySpark i uruchom następujący kod.
from pyspark.sql.functions import lit
df = spark.createDataFrame([
("1972-01-01T00:00:00Z", 826.0),
("1972-02-01T00:00:00Z", 799.0),
("1972-03-01T00:00:00Z", 890.0),
("1972-04-01T00:00:00Z", 900.0),
("1972-05-01T00:00:00Z", 766.0),
("1972-06-01T00:00:00Z", 805.0),
("1972-07-01T00:00:00Z", 821.0),
("1972-08-01T00:00:00Z", 20000.0),
("1972-09-01T00:00:00Z", 883.0),
("1972-10-01T00:00:00Z", 898.0),
("1972-11-01T00:00:00Z", 957.0),
("1972-12-01T00:00:00Z", 924.0),
("1973-01-01T00:00:00Z", 881.0),
("1973-02-01T00:00:00Z", 837.0),
("1973-03-01T00:00:00Z", 9000.0)
], ["timestamp", "value"]).withColumn("group", lit("series1"))
df.write.mode("overwrite").saveAsTable("anomaly_detector_testing_data")
Tabela Spark o nazwie anomaly_detector_testing_data powinna być teraz wyświetlana w domyślnej bazie danych Spark.
Otwieranie kreatora usług Azure AI
Kliknij prawym przyciskiem myszy tabelę Spark utworzoną w poprzednim kroku. Wybierz pozycję Machine Learning Predict with a model (Przewidywanie uczenia>maszynowego za pomocą modelu), aby otworzyć kreatora.
Zostanie wyświetlony panel konfiguracji i zostanie wyświetlony monit o wybranie wstępnie wytrenowanego modelu. Wybierz pozycję Narzędzie do wykrywania anomalii.
Konfigurowanie Narzędzie do wykrywania anomalii
Podaj następujące szczegóły, aby skonfigurować Narzędzie do wykrywania anomalii:
Połączona usługa Azure Cognitive Services: w ramach kroków wymagań wstępnych utworzono połączoną usługę z usługą Azure AI. Wybierz go tutaj.
Stopień szczegółowości: szybkość próbkowania danych. Wybierz pozycję co miesiąc.
Kolumna znacznika czasu: kolumna reprezentująca czas serii. Wybierz znacznik czasu (ciąg).
Kolumna wartości szeregów czasowych: kolumna reprezentująca wartość serii w czasie określonym przez kolumnę Sygnatura czasowa. Wybierz wartość (podwójnie)..
Kolumna grupowania: kolumna, która grupuje serię. Oznacza to, że wszystkie wiersze, które mają tę samą wartość w tej kolumnie, powinny utworzyć jeden szereg czasowy. Wybierz grupę (ciąg).
Po zakończeniu wybierz pozycję Otwórz notes. Spowoduje to wygenerowanie notesu za pomocą kodu PySpark, który używa usług Azure AI do wykrywania anomalii.
Uruchamianie notesu
Otwarty notes używa biblioteki SynapseML do łączenia się z usługami Azure AI. Udostępniona usługa połączona azure AI umożliwia bezpieczne odwołowanie się do usługi Azure AI z tego środowiska bez ujawniania żadnych wpisów tajnych.
Teraz można uruchomić wszystkie komórki w celu przeprowadzenia wykrywania anomalii. Wybierz pozycję Uruchom wszystko. Dowiedz się więcej o Narzędzie do wykrywania anomalii w usługach azure AI.
Następne kroki
- Samouczek: analiza tonacji za pomocą usług Azure AI
- Samouczek: ocenianie modelu uczenia maszynowego w dedykowanych pulach SQL usługi Azure Synapse
- Samouczek: używanie wielowariancji Narzędzie do wykrywania anomalii w usłudze Azure Synapse Analytics
- Możliwości uczenia maszynowego w usłudze Azure Synapse Analytics