Udostępnij za pośrednictwem


Ważność funkcji permutacji

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Oblicza oceny ważności funkcji permutacji dla zmiennych cech na danych wytrenowany model i testowy zestaw danych

Kategoria: Moduły wyboru funkcji

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób użycia modułu Permutation Feature Importance (Ważność funkcji permutacji) w programie Machine Learning Studio (wersja klasyczna) w celu obliczenia zestawu ocen ważności funkcji dla zestawu danych. Te wyniki ułatwiają określenie najlepszych funkcji do użycia w modelu.

W tym module wartości cech są losowo mieszane, po jednej kolumnie na raz, a wydajność modelu jest mierzona przed i po. Możesz wybrać jedną ze standardowych metryk, aby zmierzyć wydajność.

Wyniki zwracane przez moduł reprezentują zmianę wydajności wytrenowany model po permutacji. Ważne funkcje są zwykle bardziej wrażliwe na proces shufflinga i w związku z tym będą skutkować wyższymi wynikami ważności.

Ten artykuł zawiera dobre ogólne omówienie znaczenia funkcji permutacji, podstawy teoretycznej i jej zastosowań w uczeniu maszynowym: znaczenie funkcji permutacji

Jak używać ważności funkcji permutacji

Aby wygenerować zestaw wyników funkcji, musisz mieć już wytrenowany model, a także testowy zestaw danych.

  1. Dodaj moduł Permutation Feature Importance (Ważność funkcji permutacji ) do eksperymentu. Ten moduł można znaleźć w kategorii Wybór funkcji.

  2. Połączenie wytrenowany model do danych wejściowych po lewej stronie. Model musi być modelem regresji lub modelem klasyfikacji.

  3. Po prawej stronie danych wejściowych połącz zestaw danych, najlepiej taki, który różni się od zestawu danych używanego do trenowania modelu. Ten zestaw danych jest używany do oceniania na podstawie wytrenowany model oraz do oceny modelu po zmianie wartości cech.

  4. W przypadku losowego inicjały wpisz wartość do użycia jako iniekcja na użytek losowania. Jeśli określisz 0 (wartość domyślna), liczba jest generowana na podstawie zegara systemowego.

    Wartość iniekcyjna jest opcjonalna, ale należy podać wartość, jeśli chcesz odtwarzać przebiegi tego samego eksperymentu.

  5. W przypadku opcji Metryka do mierzenia wydajności wybierz pojedynczą metrykę do użycia podczas obliczania jakości modelu po permutacji.

    Machine Learning Studio (klasyczne) obsługuje następujące metryki w zależności od tego, czy oceniasz model klasyfikacji, czy regresji:

    • Klasyfikacja

      Dokładność, Precyzja, Odwoływanie, Średnia utrata dziennika

    • Regresja

      Precyzja, przywołanie, średni bezwzględny błąd, główny błąd średniej kwadratowej, względny błąd bezwzględny, względny błąd kwadratowy, współczynnik oznaczania

    Aby uzyskać bardziej szczegółowy opis tych metryk oceny i sposób ich obliczania, zobacz Evaluate (Ocena).

  6. Uruchom eksperyment.

  7. Moduł wyprowadza listę kolumn funkcji i skojarzonych z nimi wyników uporządkowanych malejąco w kolejności wyników.

Przykłady

Zobacz te przykładowe eksperymenty w Azure AI Gallery:

Uwagi techniczne

Ta sekcja zawiera szczegółowe informacje o implementacji, porady i odpowiedzi na często zadawane pytania.

Jak wygląda to w porównaniu z innymi metodami wyboru funkcji?

Znaczenie funkcji permutacji działa przez losową zmianę wartości każdej kolumny cech, jedną kolumnę na raz, a następnie ocenę modelu.

Klasyfikacje zapewniane przez ważność funkcji permutacji często różnią się od klasyfikacji z wyboru funkcji na podstawie filtru, który oblicza wyniki przed utworzeniem modelu.

Wynika to z tego, że znaczenie funkcji permutacji nie mierzy skojarzenia między cechą a wartością docelową, ale przechwytuje wpływ każdej funkcji na przewidywania z modelu.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Wytrenowany model ILearner, interfejs Wytrenowany model klasyfikacji lub regresji
Dane testowe Tabela danych Testowy zestaw danych do oceniania i oceniania modelu po permutacji wartości cech

Parametry modułu

Nazwa Typ Zakres Opcjonalne Domyślny Opis
Iniekt losowy Liczba całkowita >= 0 Wymagane 0 Wartość iniekcyjna generatora liczb losowych
Metryka pomiaru wydajności EvaluationMetricType wybieranie z listy Wymagane Klasyfikacja — dokładność Wybierz metrykę do użycia podczas oceny zmienności modelu po permutacjach

Dane wyjściowe

Nazwa Typ Opis
Ważność funkcji Tabela danych Zestaw danych zawierający wyniki ważności funkcji na podstawie wybranej metryki

Wyjątki

Wyjątek Opis
Błąd 0062 Wyjątek występuje podczas próby porównania dwóch modeli z różnymi typami uczących się.
Błąd 0024 Wyjątek występuje, jeśli zestaw danych nie zawiera kolumny etykiety.
Błąd 0105 Zgłaszany, gdy plik definicji modułu definiuje niezaimportowany typ parametru
Błąd 0021 Wyjątek występuje, gdy liczba wierszy w niektórych zestawach danych przekazanych do modułu jest zbyt mała.

Zobacz też

Wybór funkcji
Wybór funkcji oparty na filtrze
Analiza głównych składników