Przekształcanie danych — manipulowanie
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
W tym artykule opisano moduły w programie Machine Learning Studio (wersja klasyczna), których można używać do podstawowego manipulowania danymi.
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Machine Learning Studio (klasyczne) obsługuje zadania specyficzne dla uczenia maszynowego, takie jak normalizacja lub wybór funkcji. Moduły w tej kategorii są przeznaczone do bardziej ogólnych zadań.
Zadania manipulowania danymi
Moduły w tej kategorii są przeznaczone do obsługi podstawowych zadań zarządzania danymi, które mogą być wykonywane w programie Machine Learning Studio (wersja klasyczna). Poniżej przedstawiono przykłady podstawowych zadań zarządzania danymi:
- Połącz dwa zestawy danych za pomocą sprzężenia lub scalając kolumny lub wiersze.
- Utwórz nowe kategorie do użycia podczas grupowania danych.
- Modyfikowanie nagłówków kolumn, zmienianie typów danych kolumn lub flagowanie kolumn jako cech lub etykiet.
- Sprawdź brakujące wartości, a następnie zastąp je odpowiednimi wartościami.
Zadania powiązane
- Wykonaj próbkowanie lub podziel zestaw danych na zestaw szkoleniowy i testowy: użyj modułów Przekształcanie danych — próbkowanie i dzielenie .
- Skaluj liczby, normalizuj dane lub umieszczaj wartości liczbowe w pojemnikach: użyj modułów Przekształcanie danych — skalowanie i zmniejszanie .
- Wykonywanie obliczeń na polach danych liczbowych lub generowanie często używanych statystyk: Użyj narzędzi w funkcjach statystycznych.
Przykłady
Przykłady pracy ze złożonymi danymi w eksperymentach uczenia maszynowego można znaleźć w tych przykładach w Azure AI Gallery:
- Przetwarzanie i analiza danych: Demonstruje kluczowe narzędzia i procesy.
- Wykrywanie raka choroby: Ilustruje sposób partycjonowania zestawów danych, a następnie stosowania specjalnego przetwarzania do każdej partycji.
Moduły w tej kategorii
Kategoria Przekształcanie danych — Manipulowanie obejmuje następujące moduły:
- Dodaj kolumny: dodaje zestaw kolumn z jednego zestawu danych do innego.
- Dodaj wiersze: dołącza zestaw wierszy z wejściowego zestawu danych na końcu innego zestawu danych.
- Zastosuj SQL danych: uruchamia zapytanie SQLite dla wejściowych zestawów danych w celu przekształcenia danych.
- Czyszczenie brakujących danych: określa sposób obsługi wartości, których brakuje w zestawie danych. Ten moduł zastępuje moduł Missing Values Scrubber (Czyszczenie brakujących wartości), który został wycofany.
- Konwertuj na wartości wskaźnika: konwertuje wartości kategorii w kolumnach na wartości wskaźników.
- Edytowanie metadanych: edytuje metadane skojarzone z kolumnami w zestawie danych.
- Grupuj wartości podzielone na kategorie: grupuje dane z wielu kategorii w nową kategorię.
- Połącz dane: łączy dwa zestawy danych.
- Usuń zduplikowane wiersze: usuwa zduplikowane wiersze z zestawu danych.
- Wybierz pozycję Kolumny w zestawie danych: wybiera kolumny do dołączyć do zestawu danych lub wykluczyć je z zestawu danych w operacji.
- Wybieranie przekształcenia kolumn: tworzy przekształcenie, które wybiera ten sam podzbiór kolumn, co w określonym zestawie danych.
- SMOTE: Zwiększa liczbę przykładów o niskiej częstotliwości w zestawie danych przy użyciu syntetyczną oversampling.