Zastosuj filtr
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Stosuje filtr do określonych kolumn zestawu danych
Kategoria: Przekształcanie/filtrowanie danych
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób używania modułu Zastosuj filtr w programie Machine Learning Studio (wersja klasyczna) do przekształcania kolumny wartości przez zastosowanie wcześniej zdefiniowanego filtru. Filtry są używane w przetwarzaniu sygnału cyfrowego w celu zmniejszenia szumu lub wyróżnienia wzorca. W związku z tym przekształcane wartości są zawsze liczbowe i zazwyczaj reprezentują pewien rodzaj sygnału dźwiękowego lub wizualnego.
Porada
Szukasz innego typu filtru? Program Studio (klasyczny) udostępnia te moduły do próbkowania danych, pobierania podzestawu danych, usuwania złych wartości lub tworzenia zestawów testowych i treningowych: Dzieleniedanych, Czyszczenie brakujących danych,Partycja i Przykład, Stosowanie przekształcenia SQL, Clip Values. Jeśli musisz filtrować dane podczas odczytywania ich ze źródła, zobacz Importowanie danych. Opcje zależą od typu źródła.
Po określeniu, który typ filtru jest najlepszy dla źródła danych, należy określić parametry i użyć funkcji Zastosuj filtr , aby przekształcić zestaw danych. Ponieważ projekt filtrów jest oddzielony od procesu stosowania filtru, filtry są wielokrotnego użytku. Jeśli na przykład często pracujesz z danymi używanymi do prognozowania, możesz zaprojektować kilka typów filtrów średniej ruchomej do trenowania i porównywania wielu modeli. Możesz również zapisać filtr, aby zastosować go do innych eksperymentów lub do różnych zestawów danych.
Jak skonfigurować stosowanie filtru
Dodaj moduł Zastosuj filtr do eksperymentu. Moduł filtru IIR można znaleźć w obszarze Przekształcanie danych w kategorii Filtry.
Z prawym przyciskiem myszy połącz zestaw danych zawierający wartości liczbowe z jednym elementem wejściowym.
Z lewymi elementami wejściowymi połącz istniejący filtr. Możesz ponownie użyć zapisanego filtru lub skonfigurować filtr przy użyciu jednego z następujących modułów filtrów: Filtrprogu, Filtr średniej ruchomej, Filtr mediany, Filtr IIR, Filtr FIR, Filtr zdefiniowany przez użytkownika.
W okienku Właściwości okna Zastosuj filtr kliknij pozycję Uruchom selektora kolumn i wybierz kolumny, do których ma zostać zastosowany filtr.
Uruchom eksperyment lub kliknij prawym przyciskiem myszy pozycję Zastosuj filtr i kliknij polecenie Uruchom wybrane.
Wyniki
Dane wyjściowe zawierają tylko dane w wybranych kolumnach, przekształcone przez zastosowanie określonego wstępnie zdefiniowanego przekształcenia matematycznego.
Jeśli chcesz zobaczyć inne kolumny w zestawie danych, możesz użyć modułu Dodaj kolumny, aby scalić oryginalne i przefiltrowane zestawy danych.
Uwaga
Wartości w oryginalnej kolumnie nie zostały usunięte ani zastąpione i są nadal dostępne w eksperymencie do odwołania. Jednak dane wyjściowe filtru zwykle są bardziej przydatne podczas modelowania.
Przykłady
Przykłady stosowania filtrów w uczeniu maszynowym można znaleźć w Azure AI Gallery:
- Filtry: przedstawia wszystkie typy filtrów przy użyciu zestawu danych o formie falowej.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.
Moduł Zastosuj filtr wiąże określony typ filtru z wybranymi kolumnami. Jeśli chcesz zastosować różne typy filtrów do różnych kolumn, użyj opcji Wybierz kolumny w zestawie danych, aby odizolować kolumny i zastosować różne typy filtrów w oddzielnych przepływach pracy. Aby uzyskać więcej informacji, zobacz Select Columns in Dataset (Wybieranie kolumn w zestawie danych).
Filtry nie przechodzą przez kolumny danych, na które nie ma wpływu filtr. Oznacza to, że dane wyjściowe funkcji Zastosuj filtr zawierają tylko przekształcone wartości liczbowe. Można jednak użyć modułu Dodaj kolumny , aby połączyć przekształcone wartości ze źródłowym zestawem danych.
Okresy filtrowania
Okres filtru jest częściowo określany przez typ filtru w następujący sposób:
W przypadku odpowiedzi finite impulse (FIR), prostej średniej ruchomej i trójkątnych filtrów średniej ruchomej okres filtrowania jest skończony.
W przypadku nieskończonej odpowiedzi impulsowej (IIR), wykładniczej średniej ruchomej i skumulowanej średniej ruchomej filtrów okres filtrowania jest nieskończony.
W przypadku filtrów progowych okres filtrowania to zawsze 1.
W przypadku filtrów mediany, niezależnie od okresu filtru, sieci NaN i brakujące wartości w sygnałie wejściowym nie dają nowych wartości NaN w danych wyjściowych.
Brakujące wartości
W tej sekcji opisano zachowanie w przypadku napotkania brakujących wartości według typu filtru. Ogólnie rzecz biorąc, gdy filtr napotka wartość NaN lub brakującą wartość w wejściowym zestawie danych, wyjściowy zestaw danych zostanie zaadeksowany przy użyciu wartości NaN dla kolejnej liczby próbek, w zależności od okresu filtrowania. Ma to następujące konsekwencje:
FiR, proste filtry średniej ruchomej lub trójkątne średnie ruchome mają skończony okres. W związku z tym po każdej brakującej wartości będzie następuje liczba wartości NaN równa kolejności filtrowania minus jeden.
Filtry IIR, wykładnicza średnia ruchoma lub skumulowana średnia ruchoma mają nieskończony okres. W związku z tym po napotkaniu pierwszej brakującej wartości sieci NaN będą nadal propagowane przez czas nieokreślony.
W filtrze progowym okres filtru progu wynosi 1. W związku z tym brakujące wartości i wartości NaN nie są propagowane.
W przypadku filtrów mediany wartości NaN i brakujące wartości napotkane w wejściowym zestawie danych nie dają nowych wartości NaN w danych wyjściowych, niezależnie od okresu filtru.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Filtr | IFilter, interfejs | Implementacja filtru |
Zestaw danych | Tabela danych | Wejściowy zestaw danych |
Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.
Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).
Parametry modułu
Nazwa | Zakres | Typ | Domyślny | Opis |
---|---|---|---|---|
Zestaw kolumn | Dowolne | ColumnSelection | NumericAll | Wybieranie kolumn do filtrowania |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Zestaw danych wyników | Tabela danych | Wyjściowy zestaw danych |