Ważność funkcji permutacji
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Oblicza oceny ważności funkcji permutacji dla zmiennych cech na danych wytrenowany model i testowy zestaw danych
Kategoria: Moduły wyboru funkcji
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób użycia modułu Permutation Feature Importance (Ważność funkcji permutacji) w programie Machine Learning Studio (wersja klasyczna) w celu obliczenia zestawu ocen ważności funkcji dla zestawu danych. Te wyniki ułatwiają określenie najlepszych funkcji do użycia w modelu.
W tym module wartości cech są losowo mieszane, po jednej kolumnie na raz, a wydajność modelu jest mierzona przed i po. Możesz wybrać jedną ze standardowych metryk, aby zmierzyć wydajność.
Wyniki zwracane przez moduł reprezentują zmianę wydajności wytrenowany model po permutacji. Ważne funkcje są zwykle bardziej wrażliwe na proces shufflinga i w związku z tym będą skutkować wyższymi wynikami ważności.
Ten artykuł zawiera dobre ogólne omówienie znaczenia funkcji permutacji, podstawy teoretycznej i jej zastosowań w uczeniu maszynowym: znaczenie funkcji permutacji
Jak używać ważności funkcji permutacji
Aby wygenerować zestaw wyników funkcji, musisz mieć już wytrenowany model, a także testowy zestaw danych.
Dodaj moduł Permutation Feature Importance (Ważność funkcji permutacji ) do eksperymentu. Ten moduł można znaleźć w kategorii Wybór funkcji.
Połączenie wytrenowany model do danych wejściowych po lewej stronie. Model musi być modelem regresji lub modelem klasyfikacji.
Po prawej stronie danych wejściowych połącz zestaw danych, najlepiej taki, który różni się od zestawu danych używanego do trenowania modelu. Ten zestaw danych jest używany do oceniania na podstawie wytrenowany model oraz do oceny modelu po zmianie wartości cech.
W przypadku losowego inicjały wpisz wartość do użycia jako iniekcja na użytek losowania. Jeśli określisz 0 (wartość domyślna), liczba jest generowana na podstawie zegara systemowego.
Wartość iniekcyjna jest opcjonalna, ale należy podać wartość, jeśli chcesz odtwarzać przebiegi tego samego eksperymentu.
W przypadku opcji Metryka do mierzenia wydajności wybierz pojedynczą metrykę do użycia podczas obliczania jakości modelu po permutacji.
Machine Learning Studio (klasyczne) obsługuje następujące metryki w zależności od tego, czy oceniasz model klasyfikacji, czy regresji:
Klasyfikacja
Dokładność, Precyzja, Odwoływanie, Średnia utrata dziennika
Regresja
Precyzja, przywołanie, średni bezwzględny błąd, główny błąd średniej kwadratowej, względny błąd bezwzględny, względny błąd kwadratowy, współczynnik oznaczania
Aby uzyskać bardziej szczegółowy opis tych metryk oceny i sposób ich obliczania, zobacz Evaluate (Ocena).
Uruchom eksperyment.
Moduł wyprowadza listę kolumn funkcji i skojarzonych z nimi wyników uporządkowanych malejąco w kolejności wyników.
Przykłady
Zobacz te przykładowe eksperymenty w Azure AI Gallery:
Znaczenie funkcji permutacji: pokazuje, jak używać tego modułu do klasyfikacji zmiennych cech zestawu danych w kolejności ocen ważności permutacji.
Korzystanie z modułu Permutation Feature Importance (Ważność funkcji permutacji): ilustruje użycie tego modułu w usłudze internetowej.
Uwagi techniczne
Ta sekcja zawiera szczegółowe informacje o implementacji, porady i odpowiedzi na często zadawane pytania.
Jak wygląda to w porównaniu z innymi metodami wyboru funkcji?
Znaczenie funkcji permutacji działa przez losową zmianę wartości każdej kolumny cech, jedną kolumnę na raz, a następnie ocenę modelu.
Klasyfikacje zapewniane przez ważność funkcji permutacji często różnią się od klasyfikacji z wyboru funkcji na podstawie filtru, który oblicza wyniki przed utworzeniem modelu.
Wynika to z tego, że znaczenie funkcji permutacji nie mierzy skojarzenia między cechą a wartością docelową, ale przechwytuje wpływ każdej funkcji na przewidywania z modelu.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Wytrenowany model | ILearner, interfejs | Wytrenowany model klasyfikacji lub regresji |
Dane testowe | Tabela danych | Testowy zestaw danych do oceniania i oceniania modelu po permutacji wartości cech |
Parametry modułu
Nazwa | Typ | Zakres | Opcjonalne | Domyślny | Opis |
---|---|---|---|---|---|
Iniekt losowy | Liczba całkowita | >= 0 | Wymagane | 0 | Wartość iniekcyjna generatora liczb losowych |
Metryka pomiaru wydajności | EvaluationMetricType | wybieranie z listy | Wymagane | Klasyfikacja — dokładność | Wybierz metrykę do użycia podczas oceny zmienności modelu po permutacjach |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Ważność funkcji | Tabela danych | Zestaw danych zawierający wyniki ważności funkcji na podstawie wybranej metryki |
Wyjątki
Wyjątek | Opis |
---|---|
Błąd 0062 | Wyjątek występuje podczas próby porównania dwóch modeli z różnymi typami uczących się. |
Błąd 0024 | Wyjątek występuje, jeśli zestaw danych nie zawiera kolumny etykiety. |
Błąd 0105 | Zgłaszany, gdy plik definicji modułu definiuje niezaimportowany typ parametru |
Błąd 0021 | Wyjątek występuje, gdy liczba wierszy w niektórych zestawach danych przekazanych do modułu jest zbyt mała. |
Zobacz też
Wybór funkcji
Wybór funkcji oparty na filtrze
Analiza głównych składników