Przekształcanie danych — skalowanie i zmniejszanie
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
W tym artykule opisano moduły w programie Machine Learning Studio (wersja klasyczna), które mogą ułatwić pracę z danymi liczbowych. W przypadku uczenia maszynowego typowe zadania dotyczące danych obejmują przycinanie, bicie i normalizację wartości liczbowych. Inne moduły obsługują redukcję wymiarowości.
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Modelowanie danych liczbowych
Zadania, takie jak normalizacja, bicie lub redystrybucja zmiennych liczbowych, są ważną częścią przygotowywania danych do uczenia maszynowego. Moduły w tej grupie obsługują następujące zadania przygotowywania danych:
- Grupowanie danych w pojemniki o różnych rozmiarach lub dystrybucjach.
- Usuwanie wartości od zewnątrz lub zmienianie ich wartości.
- Normalizowanie zestawu wartości liczbowych do określonego zakresu.
- Tworzenie zwartego zestawu kolumn cech z zestawu danych o wysokim wymiarze.
Zadania powiązane
- Wybierz odpowiednie i przydatne funkcje, które mają być przydatne podczas tworzenia modelu: użyj modułów Wybór cech lub Dyskryminowanie liniowe programu Linear Discriminant Analysis .
- Wybierz funkcje na podstawie liczby wartości: użyj modułu Edukacja z liczbami.
- Usuń lub zamień brakujące wartości: użyj modułu Clean Missing Data (Czyszczenie brakujących danych).
- Zastąp wartości podzielone na kategorie wartościami liczbami pochodzącymi z obliczeń: użyj modułu Zastąp wartości dyskretne .
- Obliczanie rozkładu prawdopodobieństwa dla kolumn dyskretnych lub liczbowych: użyj modułu Evaluate Probability Function (Ocena funkcji prawdopodobieństwa ).
- Filtrowanie i przekształcanie sygnałów cyfrowych i formularzy falowych: użyj modułu Filter .
Lista modułów
Ta kategoria Przekształcanie danych — skalowanie i zmniejszanie obejmuje następujące moduły:
- Obcinanie wartości: wykrywa wartości odejmowe, a następnie klipuje lub zastępuje ich wartości.
- Grupowanie danych w pojemniki: umieszcza dane liczbowe w pojemnikach.
- Normalizowanie danych: ponownie skaluje dane liczbowe, aby ograniczyć wartości zestawu danych do zakresu standardowego.
- Analiza głównych składników: oblicza zestaw cech, które mają ograniczoną wymiarowość, aby skuteczniej uczyć się.