Udostępnij za pośrednictwem


Regresja Poissona

Ostrzeżenie

Ten składnik ZOSTAŁ PRZESTARZAŁY , ponieważ jego zależność , projekt NimbusML , nie jest już aktywnie utrzymywana. W związku z tym ten składnik nie będzie otrzymywać przyszłych aktualizacji ani poprawek zabezpieczeń. Planujemy usunąć ten składnik w nadchodzących wersjach. Zaleca się migrowanie użytkowników do alternatywnych rozwiązań w celu zapewnienia ciągłej obsługi i zabezpieczeń.

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Ten składnik służy do tworzenia modelu regresji Poissona w potoku. Regresja Poissona jest przeznaczona do przewidywania wartości liczbowych, zwykle zliczania. W związku z tym należy użyć tego składnika do utworzenia modelu regresji tylko wtedy, gdy wartości, które próbujesz przewidzieć, pasują do następujących warunków:

  • Zmienna odpowiedzi ma rozkład Poissona.

  • Liczby nie mogą być ujemne. Metoda zakończy się niepowodzeniem w przypadku próby użycia jej z etykietami ujemnymi.

  • Rozkład Poissona jest dyskretnym rozkładem; w związku z tym nie ma znaczenia, aby używać tej metody z liczbami niezwiązanymi.

Napiwek

Jeśli cel nie jest liczbą, regresja Poissona prawdopodobnie nie jest odpowiednią metodą. Wypróbuj inne składniki regresji w projektancie.

Po skonfigurowaniu metody regresji należy wytrenować model przy użyciu zestawu danych zawierającego przykłady wartości, którą chcesz przewidzieć. Następnie wytrenowany model może służyć do przewidywania.

Więcej informacji na temat regresji Poissona

Regresja Poissona jest specjalnym typem analizy regresji, która jest zwykle używana do modelowania liczb. Na przykład regresja Poissona byłaby przydatna w następujących scenariuszach:

  • Modelowanie liczby chłodni związanych z lotami samolotowymi

  • Szacowanie liczby wezwań służb ratowniczych podczas zdarzenia

  • Prognozowanie liczby zapytań klientów po podwyższeniu poziomu

  • Tworzenie tabel awaryjnych

Ponieważ zmienna odpowiedzi ma rozkład Poissona, model dokonuje różnych założeń dotyczących danych i rozkładu prawdopodobieństwa niż, na przykład regresja najmniejszych kwadratów. W związku z tym modele Poissona powinny być interpretowane inaczej niż inne modele regresji.

Jak skonfigurować regresję Poissona

  1. Dodaj składnik Regresja Poissona do potoku w projektancie. Ten składnik można znaleźć w obszarze Algorytmy uczenia maszynowego w kategorii Regresja .

  2. Dodaj zestaw danych zawierający dane szkoleniowe poprawnego typu.

    Zalecamy użycie funkcji Normalize Data (Normalizacja danych ) w celu normalizacji wejściowego zestawu danych przed użyciem go do trenowania regresji.

  3. W okienku po prawej stronie składnika Regresja Poissona określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, podaj określony zestaw wartości jako argumenty.

    • Zakres parametrów: jeśli nie masz pewności co do najlepszych parametrów, wykonaj zamiatanie parametrów przy użyciu składnika Dostrajanie hiperparametrów modelu. Trener iteruje wiele wartości, które określisz, aby znaleźć optymalną konfigurację.

  4. Tolerancja optymalizacji: wpisz wartość, która definiuje interwał tolerancji podczas optymalizacji. Im niższa wartość, wolniejsze i dokładniejsze dopasowanie.

  5. L1 waga regularnej i waga regularyzacji L2: wartości typów do użycia na potrzeby regularyzacji L1 i L2. Regularyzacja dodaje ograniczenia do algorytmu dotyczące aspektów modelu, które są niezależne od danych treningowych. Regularyzacja jest często stosowana w celu uniknięcia nadmiernego dopasowania.

    • Regularyzacja L1 jest przydatna, jeśli celem jest posiadanie modelu, który jest tak rozrzedniejszy, jak to możliwe.

      Regularyzacja L1 jest wykonywana przez odjęcie wagi L1 wektora wagi z wyrażenia straty, że osoba ucząca się próbuje zminimalizować. Norma L1 jest dobrym przybliżeniem normy L0, która jest liczbą współrzędnych niezerowych.

    • Regularyzacja L2 uniemożliwia każdą pojedynczą współrzędną w wektorze wagi przed wzrostem zbyt dużej wielkości. Regularyzacja L2 jest przydatna, jeśli celem jest posiadanie modelu o małych wagach ogólnych.

    W tym składniku można zastosować kombinację regularyzacji L1 i L2. Łącząc uregulowania L1 i L2, można nałożyć karę na wielkość wartości parametrów. Uczeń próbuje zminimalizować karę, w kompromisie z minimalizacją straty.

    Aby zapoznać się z dobrą dyskusją na temat regularyzacji L1 i L2, zobacz Artykuły L1 i L2 Regularization for Machine Learning (Regularyzacja L1 i L2 na potrzeby uczenia maszynowego).

  6. Rozmiar pamięci dla L-BFGS: określ ilość pamięci do zarezerwowania na potrzeby dopasowania i optymalizacji modelu.

    L-BFGS to konkretna metoda optymalizacji oparta na algorytmie Broyden-Fletcher-Goldfarb-Shanno (BFGS). Metoda używa ograniczonej ilości pamięci (L) do obliczenia następnego kroku.

    Zmieniając ten parametr, można wpływać na liczbę poprzednich pozycji i gradientów przechowywanych na potrzeby obliczeń następnego kroku.

  7. Połącz zestaw danych trenowania i nietrenowany model z jednym ze składników szkoleniowych:

    • Jeśli ustawisz opcję Utwórz tryb trenera na Pojedynczy parametr, użyj składnika Train Model (Trenowanie modelu).

    • Jeśli ustawisz opcję Utwórz tryb trenera na Zakres parametrów, użyj składnika Dostrajanie hiperparametrów modelu.

    Ostrzeżenie

    • Jeśli przekażesz zakres parametrów do trenowania modelu, użyje tylko pierwszej wartości na liście zakresów parametrów.

    • Jeśli przekażesz jeden zestaw wartości parametrów do składnika Dostrajanie hiperparametrów modelu, gdy oczekuje ona zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    • Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość jest używana w trakcie zamiatania, nawet jeśli inne parametry zmienią się w zakresie wartości.

  8. Prześlij potok.

Wyniki

Po zakończeniu szkolenia:

  • Aby zapisać migawkę wytrenowanego modelu, wybierz składnik trenowania, a następnie przejdź do karty Dane wyjściowe i dzienniki w prawym panelu. Kliknij ikonę Zarejestruj zestaw danych. Zapisany model można znaleźć jako składnik w drzewie składników.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.