Prognozowanie (bezserwerowe) przy użyciu rozwiązania AutoML
W tym artykule pokazano, jak uruchomić bezserwerowy eksperyment prognozowania przy użyciu interfejsu użytkownika do trenowania modelu Mosaic AI.
Trenowanie modelu mozaiki sztucznej inteligencji — prognozowanie upraszcza prognozowanie danych szeregów czasowych przez automatyczne wybranie najlepszego algorytmu i hiperparametrów, a wszystko to przy jednoczesnym uruchomieniu w pełni zarządzanych zasobów obliczeniowych.
Aby zrozumieć różnicę między prognozowanie bezserwerowe i klasyczne prognozowanie obliczeń, zobacz Prognozowanie bezserwerowe a klasyczne prognozowanie obliczeń.
Wymagania
Dane szkoleniowe z kolumną szeregu czasowego zapisane jako tabelę Unity Catalog.
Jeśli obszar roboczy ma włączoną usługę Secure Egress Gateway (SEG),
należy dodać do listy dozwolonych domen . Zobacz Zarządzanie politykami sieciowymi w celu bezserwerowej kontroli ruchu wychodzącego.
Tworzenie eksperymentu prognozowania za pomocą interfejsu użytkownika
Przejdź do strony docelowej usługi Azure Databricks i kliknij pozycję Eksperymenty na pasku bocznym.
Na kafelku Prognozowanie wybierz opcję Rozpocznij trening.
Wybierz dane treningowe z listy tabel katalogu Unity, do których masz dostęp.
-
Kolumna czasu: Wybierz kolumnę zawierającą okresy dla serii czasowej. Kolumny muszą być typu
timestamp
lubdate
. - częstotliwość prognozy: wybierz jednostkę czasu reprezentującą częstotliwość danych wejściowych. Na przykład minuty, godziny, dni, miesiące. Określa stopień szczegółowości szeregów czasowych.
- horyzont prognozy: określ liczbę jednostek wybranej częstotliwości do prognozowania w przyszłości. Wraz z częstotliwością prognozy definiuje to zarówno jednostki czasu, jak i liczbę jednostek czasu, które mają być prognozowane.
Notatka
Aby użyć algorytmu Auto-ARIMA, szereg czasowy musi mieć regularną częstotliwość, w której interwał między dwoma punktami musi być taki sam w ciągu szeregu czasowego. Rozwiązanie AutoML obsługuje brakujące kroki czasu, wypełniając te wartości poprzednimi wartościami.
-
Kolumna czasu: Wybierz kolumnę zawierającą okresy dla serii czasowej. Kolumny muszą być typu
Wybierz kolumnę docelową przewidywania , którą ma przewidywać model.
Opcjonalnie określ tabelę Unity Catalog ścieżkę danych prognozowania do przechowywania wynikowych prognoz.
Wybierz lokalizację i nazwę rejestracji Modelu w Unity Catalog.
Opcjonalnie ustaw opcje zaawansowane :
- nazwa eksperymentu: podaj nazwę eksperymentu MLflow.
- kolumny identyfikatorów szeregów czasowych — w przypadku prognozowania wielu serii wybierz kolumny identyfikujące poszczególne szeregi czasowe. Usługa Databricks grupuje dane według tych kolumn jako różne serie czasowe i uczy model dla każdej serii niezależnie.
- Podstawowa metryka: wybierz podstawową metrykę używaną do oceny i wyboru najlepszego modelu.
- struktura szkoleniowa: Wybierz struktury do eksploracji AutoML.
- Podziel kolumnę: wybierz kolumnę zawierającą niestandardowy podział danych. Wartości muszą być „uczenie”, „walidacja”, „testowanie”
- Kolumna wagi: Określ kolumnę, która ma być używana do ważenia szeregów czasowych. Wszystkie próbki dla danej serii czasowej muszą mieć taką samą wagę. Waga musi znajdować się w zakresie [0, 10000].
- region wakacji: wybierz region wakacji, który ma być używany jako kowariantny w trenowaniu modelu.
- limit czasu: ustaw maksymalny czas trwania eksperymentu automatycznego uczenia maszynowego.
Uruchamianie eksperymentu i monitorowanie wyników
Aby rozpocząć eksperyment zautomatyzowanego uczenia maszynowego, kliknij przycisk Rozpocznij szkolenie. Na stronie szkoleniowej eksperymentu można wykonać następujące czynności:
- Zatrzymaj eksperyment w dowolnym momencie.
- Monitorowanie uruchomień.
- Przejdź do strony uruchomienia dla dowolnej sesji.
Wyświetlanie wyników lub używanie najlepszego modelu
Po zakończeniu trenowania wyniki przewidywania są przechowywane w określonej tabeli Delta, a najlepszy model jest zarejestrowany w katalogu Unity.
Na stronie Eksperymenty wybierz jedną z następujących następnych czynności:
- Wybierz pozycję Zobacz prognozy, aby wyświetlić tabelę wyników prognoz.
- Wybierz notatnik Batch do wnioskowania, aby otworzyć automatycznie generowany notatnik do wnioskowania wsadowego przy użyciu najlepszego modelu.
- Wybierz pozycję Utwórz punkt końcowy obsługujący, aby wdrożyć najlepszy model w punkcie końcowym obsługującym model.
prognozowanie bezserwerowe a prognozowanie przy użyciu klasycznych obliczeń
W poniższej tabeli przedstawiono podsumowanie różnic między prognozowaniem bezserwerowym a prognozowaniem przy użyciu klasycznych obliczeniowych.
Funkcja | Prognozowanie bezserwerowe | Klasyczne prognozowanie zasobów obliczeniowych |
---|---|---|
Infrastruktura obliczeniowa | Usługa Azure Databricks zarządza konfiguracją obliczeniową i automatycznie optymalizuje pod kątem kosztów i wydajności. | Obliczenia skonfigurowane przez użytkownika |
Rządzenie | Modele i artefakty zarejestrowane w Unity Catalog | Magazyn plików obszaru roboczego skonfigurowany przez użytkownika |
Wybór algorytmu | modele statystyczne oraz algorytm sieci neuronowej uczenia głębokiego DeepAR | modele statystyczne |
Integracja magazynu funkcji | Niewspierane | Obsługiwane |
Notesy generowane automatycznie | Notatnik wnioskowania wsadowego | Kod źródłowy dla wszystkich wersji próbnych |
Wdrażanie obsługi modelu jednym kliknięciem | Obsługiwane | Nieobsługiwane |
Niestandardowe podziały trenowania/walidacji/testowania | Obsługiwane | Nieobsługiwane |
Własne wagi dla poszczególnych szeregów czasowych | Wspierane | Nieobsługiwane |