Ważność funkcji permutacji

Artykuł
05/06/2019

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
Dowiedz się więcej o Azure Machine Learning.

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Oblicza oceny ważności funkcji permutacji dla zmiennych cech na danych wytrenowany model i testowy zestaw danych

Kategoria: Moduły wyboru funkcji

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób użycia modułu Permutation Feature Importance (Ważność funkcji permutacji) w programie Machine Learning Studio (wersja klasyczna) w celu obliczenia zestawu ocen ważności funkcji dla zestawu danych. Te wyniki ułatwiają określenie najlepszych funkcji do użycia w modelu.

W tym module wartości cech są losowo mieszane, po jednej kolumnie na raz, a wydajność modelu jest mierzona przed i po. Możesz wybrać jedną ze standardowych metryk, aby zmierzyć wydajność.

Wyniki zwracane przez moduł reprezentują zmianę wydajności wytrenowany model po permutacji. Ważne funkcje są zwykle bardziej wrażliwe na proces shufflinga i w związku z tym będą skutkować wyższymi wynikami ważności.

Ten artykuł zawiera dobre ogólne omówienie znaczenia funkcji permutacji, podstawy teoretycznej i jej zastosowań w uczeniu maszynowym: znaczenie funkcji permutacji

Jak używać ważności funkcji permutacji

Aby wygenerować zestaw wyników funkcji, musisz mieć już wytrenowany model, a także testowy zestaw danych.

Dodaj moduł Permutation Feature Importance (Ważność funkcji permutacji ) do eksperymentu. Ten moduł można znaleźć w kategorii Wybór funkcji.
Połączenie wytrenowany model do danych wejściowych po lewej stronie. Model musi być modelem regresji lub modelem klasyfikacji.
Po prawej stronie danych wejściowych połącz zestaw danych, najlepiej taki, który różni się od zestawu danych używanego do trenowania modelu. Ten zestaw danych jest używany do oceniania na podstawie wytrenowany model oraz do oceny modelu po zmianie wartości cech.
W przypadku losowego inicjały wpisz wartość do użycia jako iniekcja na użytek losowania. Jeśli określisz 0 (wartość domyślna), liczba jest generowana na podstawie zegara systemowego.

Wartość iniekcyjna jest opcjonalna, ale należy podać wartość, jeśli chcesz odtwarzać przebiegi tego samego eksperymentu.
W przypadku opcji Metryka do mierzenia wydajności wybierz pojedynczą metrykę do użycia podczas obliczania jakości modelu po permutacji.

Machine Learning Studio (klasyczne) obsługuje następujące metryki w zależności od tego, czy oceniasz model klasyfikacji, czy regresji:
- Klasyfikacja
  
  Dokładność, Precyzja, Odwoływanie, Średnia utrata dziennika
- Regresja
  
  Precyzja, przywołanie, średni bezwzględny błąd, główny błąd średniej kwadratowej, względny błąd bezwzględny, względny błąd kwadratowy, współczynnik oznaczania
Aby uzyskać bardziej szczegółowy opis tych metryk oceny i sposób ich obliczania, zobacz Evaluate (Ocena).
Uruchom eksperyment.
Moduł wyprowadza listę kolumn funkcji i skojarzonych z nimi wyników uporządkowanych malejąco w kolejności wyników.

Przykłady

Zobacz te przykładowe eksperymenty w Azure AI Gallery:

Znaczenie funkcji permutacji: pokazuje, jak używać tego modułu do klasyfikacji zmiennych cech zestawu danych w kolejności ocen ważności permutacji.
Korzystanie z modułu Permutation Feature Importance (Ważność funkcji permutacji): ilustruje użycie tego modułu w usłudze internetowej.

Uwagi techniczne

Ta sekcja zawiera szczegółowe informacje o implementacji, porady i odpowiedzi na często zadawane pytania.

Jak wygląda to w porównaniu z innymi metodami wyboru funkcji?

Znaczenie funkcji permutacji działa przez losową zmianę wartości każdej kolumny cech, jedną kolumnę na raz, a następnie ocenę modelu.

Klasyfikacje zapewniane przez ważność funkcji permutacji często różnią się od klasyfikacji z wyboru funkcji na podstawie filtru, który oblicza wyniki przed utworzeniem modelu.

Wynika to z tego, że znaczenie funkcji permutacji nie mierzy skojarzenia między cechą a wartością docelową, ale przechwytuje wpływ każdej funkcji na przewidywania z modelu.

Oczekiwane dane wejściowe

Nazwa	Typ	Opis
Wytrenowany model	ILearner, interfejs	Wytrenowany model klasyfikacji lub regresji
Dane testowe	Tabela danych	Testowy zestaw danych do oceniania i oceniania modelu po permutacji wartości cech

Parametry modułu

Nazwa	Typ	Zakres	Opcjonalne	Domyślny	Opis
Iniekt losowy	Liczba całkowita	>= 0	Wymagane	0	Wartość iniekcyjna generatora liczb losowych
Metryka pomiaru wydajności	EvaluationMetricType	wybieranie z listy	Wymagane	Klasyfikacja — dokładność	Wybierz metrykę do użycia podczas oceny zmienności modelu po permutacjach

Dane wyjściowe

Nazwa	Typ	Opis
Ważność funkcji	Tabela danych	Zestaw danych zawierający wyniki ważności funkcji na podstawie wybranej metryki

Wyjątki

Wyjątek	Opis
Błąd 0062	Wyjątek występuje podczas próby porównania dwóch modeli z różnymi typami uczących się.
Błąd 0024	Wyjątek występuje, jeśli zestaw danych nie zawiera kolumny etykiety.
Błąd 0105	Zgłaszany, gdy plik definicji modułu definiuje niezaimportowany typ parametru
Błąd 0021	Wyjątek występuje, gdy liczba wierszy w niektórych zestawach danych przekazanych do modułu jest zbyt mała.

Zobacz też

Wybór funkcji
Wybór funkcji oparty na filtrze
Analiza głównych składników

Udostępnij za pośrednictwem