Udostępnij za pośrednictwem


Wybieranie przekształcenia kolumn

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Tworzy przekształcenie, które wybiera ten sam podzestaw kolumn co w danym zestawie danych

Kategoria: Przekształcanie/manipulowanie danymi

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

W tym artykule opisano sposób używania modułu Select Columns Transform (Wybieranie kolumn do przekształcenia) w programie Machine Learning Studio (wersja klasyczna). Celem modułu Select Columns Transform (Wybieranie kolumn przekształć) jest zapewnienie, że przewidywalny, spójny zestaw kolumn jest zawsze używany w dalszych operacjach uczenia maszynowego.

Ten moduł jest szczególnie przydatny w przypadku zadań, takich jak ocenianie, które wymagają określonych kolumn. Zmiany w dostępnych kolumnach mogą przerwać eksperyment lub zmienić wyniki.

Użyj przekształcenia Wybierz kolumny, aby utworzyć i zapisać zestaw kolumn. Następnie użyj modułu Zastosuj przekształcenie , aby zastosować te wybory do nowych danych.

Jak używać funkcji Zaznaczanie kolumn w celu przekształcenia

W tym scenariuszu przyjęto założenie, że zamierzasz użyć wyboru funkcji do wygenerowania dynamicznego zestawu kolumn, który będzie używany do trenowania modelu. Aby upewnić się, że wybory kolumn są takie same dla procesu oceniania, należy użyć modułu Wybieranie kolumn przekształć, aby przechwycić wybrane kolumny i zastosować je w innym miejscu eksperymentu.

  1. Dodawanie wejściowego zestawu danych do eksperymentu w programie Studio (wersja klasyczna).

  2. Dodaj wystąpienie funkcji opartej na filtrze.

  3. Połączenie modułów i skonfiguruj moduł wyboru funkcji, aby automatycznie znaleźć kilka najlepszych funkcji w wejściowym zestawie danych.

  4. Dodaj wystąpienie funkcji Train Model (Trenowanie modelu ) i użyj danych wyjściowych funkcji filtru (Filter Based Feature Selection) jako danych wejściowych do trenowania.

    Ważne

    Ponieważ ważność funkcji jest decydowana na podstawie wartości w kolumnie, nie możesz z wyprzedzeniem wiedzieć, które kolumny mogą być dostępne dla danych wejściowych funkcji Train Model (Trenowanie modelu).

  5. Teraz dołącz wystąpienie modułu Select Columns Transform (Wybieranie kolumn przekształć ).

    To generuje wybór kolumny jako przekształcenie, które można zapisać lub zastosować do innych zestawów danych. Ten krok zapewnia, że kolumny identyfikowane przez wybór funkcji zostaną zapisane do ponownego użycia przez inne moduły.

  6. Dodaj moduł Score Model (Ocena modelu).

    Nie należy łączyć wejściowego zestawu danych.

    Zamiast tego dodaj moduł Apply Transformation (Zastosuj przekształcenie) i połącz dane wyjściowe przekształcenia wyboru cech.

    Ważne

    Nie można oczekiwać zastosowania wyboru funkcji na podstawie filtru do zestawu danych oceniania i uzyskania tych samych wyników. Ponieważ wybór funkcji opiera się na wartościach, może wybrać inny zestaw kolumn, co może spowodować niepowodzenie operacji oceniania.

  7. Uruchom eksperyment.

Ten proces zapisywania, a następnie stosowania wyboru kolumny gwarantuje, że ten sam schemat danych jest dostępny do trenowania i oceniania.

Przykłady

Przykłady użycia tego modułu można znaleźć w Azure AI Gallery:

Oczekiwane dane wejściowe

Nazwa Typ Opis
Zestaw danych z żądanymi kolumnami Tabela danych Zestaw danych zawierający żądany zestaw kolumn

Dane wyjściowe

Nazwa Typ Opis
Przekształcanie zaznaczenia kolumn ITransform, interfejs Przekształcenie, które wybiera ten sam podzbiór kolumn, co w danym zestawie danych.

Wyjątki

Wyjątek Opis
Błąd 0003 Wyjątek występuje, jeśli co najmniej jeden z wejść ma wartość null lub jest pusty.

Zobacz też

Manipulacji
Wybieranie kolumn w zestawie danych