Automatyczna optymalizacja personalizacji (wersja zapoznawcza)
Ważne
Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.
Wprowadzenie
Automatyczna optymalizacja personalizacji pozwala zaoszczędzić nakład pracy ręcznej w utrzymaniu pętli personalizacji w najlepszej wydajności uczenia maszynowego, automatycznie wyszukując ulepszone ustawienia uczenia używane do trenowania modeli i stosowania ich. Usługa Personalizacja ma ścisłe kryteria stosowania nowych ustawień uczenia się w celu wprowadzenia ulepszeń w zakresie ochrony przed utratą nagród.
Automatyczna optymalizacja personalizacji jest dostępna w publicznej wersji zapoznawczej i funkcje, podejścia i procesy zmienią się w oparciu o opinie użytkowników.
Kiedy używać autooptymalizowania
W większości przypadków najlepszą opcją jest włączenie automatycznej optymalizacji. Autooptymalizowanie jest włączone dla domyślnych dla nowych pętli personalizacji.
Automatyczna optymalizacja może pomóc w następujących sytuacjach:
- Tworzysz aplikacje, które są używane przez wiele dzierżaw, a każda z nich uzyskuje własne pętle personalizacji; na przykład w przypadku hostowania wielu witryn handlu elektronicznego. Automatyczna optymalizacja pozwala uniknąć ręcznego nakładu pracy, który należy dostosować do ustawień uczenia dla dużej liczby pętli personalizacji.
- Wdrożono usługę Personalizacja i sprawdzono, że działa ona dobrze, otrzymujesz dobre nagrody i upewniono się, że w funkcjach nie ma żadnych usterek ani problemów.
Uwaga
Automatyczne optymalizowanie będzie okresowo zastępować ustawienia uczenia personalizacji. Jeśli przypadek użycia lub branża wymaga inspekcji i archiwum modeli i ustawień lub jeśli potrzebujesz kopii zapasowych poprzednich ustawień, możesz użyć interfejsu API personalizacji, aby pobrać ustawienia szkoleniowe lub pobrać je za pośrednictwem witryny Azure Portal.
Jak włączyć i wyłączyć automatyczną optymalizację
Aby włączyć automatyczną optymalizację, użyj przełącznika w bloku "Ustawienia modelu i uczenia" w witrynie Azure Portal.
Alternatywnie możesz aktywować automatyczną optymalizację przy użyciu interfejsu API personalizacji /configurations/service
.
Aby wyłączyć automatyczne optymalizowanie, wyłącz przełącznik.
Automatyczne optymalizowanie raportów
W bloku Ustawienia modelu i uczenia można zobaczyć historię przebiegów automatycznego optymalizowania oraz akcję wykonaną dla każdego z nich.
W tabeli przedstawiono następujące informacje:
- Po uruchomieniu automatycznej optymalizacji,
- Jakie okno danych zostało uwzględnione,
- Jakie były wyniki nagród w trybie online, linii bazowej i najlepiej znalezionych ustawień szkoleniowych,
- Podjęte akcje: jeśli ustawienia uczenia zostały zaktualizowane lub nie.
Wydajność nagradzania różnych ustawień uczenia w każdym wierszu historii automatycznej optymalizacji są wyświetlane w liczbach bezwzględnych i jako wartości procentowe względem wydajności punktu odniesienia.
Przykład: Jeśli średnia nagroda według planu bazowego wynosi 0,20, a zachowanie personalizacji online osiągnie odpowiednio 0,30, zostaną one wyświetlone odpowiednio jako 100% i 150%. Jeśli automatyczna optymalizacja znalazła ustawienia uczenia umożliwiające osiągnięcie średniej nagrody 0,40, zostanie wyświetlona jako 200% (0,40 to 200% z 0,20). Zakładając, że marginesy ufności zezwalają na to, nowe ustawienia zostaną zastosowane, a następnie będą one napędzać usługę Personalizacja jako ustawienia online do następnego uruchomienia.
Historia do 24 poprzednich przebiegów automatycznego optymalizowania jest przechowywana na potrzeby analizy. Aby uzyskać więcej informacji na temat tych ocen offline i raportów dla każdego z nich, możesz uzyskać więcej informacji. Ponadto raporty zawierają wszystkie ustawienia uczenia, które znajdują się w tej historii, które można znaleźć i pobrać lub zastosować.
Jak to działa
Personalizacja stale szkoli modele sztucznej inteligencji, których używa na podstawie nagród. To szkolenie odbywa się zgodnie z niektórymi ustawieniami uczenia, które zawierają hiperpara parametry i inne wartości używane w procesie trenowania. Te ustawienia szkoleniowe można "dostosować" do określonego wystąpienia usługi Personalizacja.
Personalizator ma również możliwość przeprowadzania ocen w trybie offline. Oceny w trybie offline przyglądają się wcześniejszym danym i mogą generować statystyczne oszacowanie średniej nagrody, którą można osiągnąć przez personalizację różnych algorytmów i modeli. W trakcie tego procesu personalizacja będzie również wyszukiwać lepsze ustawienia uczenia się, szacując ich wydajność (ile nagród uzyskaliby) w tym okresie.
Częstotliwość automatycznego optymalizowania
Automatyczne optymalizowanie będzie okresowo uruchamiane i będzie działać automatycznie optymalizowanie na podstawie przeszłych danych
- Jeśli aplikacja wysyła do usługi Personalizacja więcej niż około 20 Mb danych w ciągu ostatnich dwóch tygodni, będzie używać danych z ostatnich dwóch tygodni.
- Jeśli aplikacja wyśle mniej niż ta ilość, usługa Personalizacja doda dane z poprzednich dni, dopóki nie będzie wystarczającej ilości danych do optymalizacji lub osiągnie najwcześniejsze przechowywane dane (do liczby dni przechowywania danych).
Dokładne czasy i dni, w których jest uruchamiana automatyczna optymalizacja, jest określana przez usługę Personalizacja i zmienia się w czasie.
Kryteria aktualizowania ustawień uczenia
Personalizacja używa tych oszacowań nagród, aby zdecydować, czy zmienić bieżące ustawienia uczenia dla innych. Każde oszacowanie jest krzywą rozkładu, z górną i dolną 95% granicą ufności. Personalizacja będzie stosować tylko nowe ustawienia szkoleniowe, jeśli:
- Wykazały wyższe średnie nagrody w okresie oceny, AND
- Mają niższą granicę 95% przedziału ufności, który jest wyższy niż niższa granica 95% przedziału ufności ustawień uczenia online. Te kryteria maksymalizowania poprawy nagrody, starając się wyeliminować prawdopodobieństwo utraty przyszłych nagród, jest zarządzane przez Personalizację i czerpie z badań w algorytmach Seldonian i bezpieczeństwie sztucznej inteligencji.
Ograniczenia automatycznej optymalizacji
Automatyczna optymalizacja personalizacji opiera się na ocenie poprzedniego okresu w celu oszacowania wydajności w przyszłości. Istnieje możliwość, że ze względu na czynniki zewnętrzne na świecie, aplikacja i użytkownicy, te oszacowania i przewidywania dotyczące modeli usługi Personalizacja wykonanych w ciągu ostatniego okresu nie są reprezentatywne dla przyszłości.
Podgląd automatycznej optymalizacji jest niedostępny dla pętli personalizacji, które włączyły funkcje interfejsu API personalizacji w wielu miejscach w wersji zapoznawczej.