Moduły uczenia maszynowego w ML Studio (klasyczne)
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Typowy przepływ pracy uczenia maszynowego składa się z wielu faz:
Identyfikowanie problemu do rozwiązania i metryki do mierzenia wyników.
Znajdowanie, czyszczenie i przygotowywanie odpowiednich danych.
Identyfikowanie najlepszych funkcji i inżynierii nowych funkcji.
Tworzenie, ocenianie i dostrajanie modeli.
Używanie modeli do generowania przewidywań, rekomendacji i innych wyników.
Moduły w tej sekcji zawierają narzędzia dla ostatnich faz uczenia maszynowego, w których stosuje się algorytm do danych w celu wyt szkolenie modelu. W tych fazach końcowych generujesz również wyniki, a następnie oceniasz dokładność i użyteczność modelu.
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Lista zadań uczenia maszynowego według kategorii
-
Wybieraj spośród różnych dostosowywalnych algorytmów uczenia maszynowego, w tym klastrowania, regresji, klasyfikacji i modeli wykrywania anomalii.
-
Udostępnij dane skonfigurowanego modelu, aby uczyć się na wzorcach i tworzyć statystyki, których można użyć do przewidywania.
-
Tworzenie przewidywań przy użyciu wytrenowane modele.
-
Zmierz dokładność wytrenowany model lub porównaj wiele modeli.
Szczegółowy opis tego eksperymentalnego przepływu pracy można znaleźć w przewodniku po rozwiązaniu do oceny ryzyka kredytowego.
Wymagania wstępne
Zanim będzie można przejść do zabawnej części tworzenia modelu, zwykle wymagane jest wiele przygotowań. Ta sekcja zawiera linki do narzędzi w programie Machine Learning Studio (wersja klasyczna), które mogą ułatwić czyszczenie danych, poprawianie jakości danych wejściowych i zapobieganie błędom w czasie działania.
Eksploracja danych i jakość danych
Upewnij się, że dane są odpowiednim rodzajem danych, odpowiednią ilością i odpowiednią jakością dla wybranego algorytmu. Dowiedz się, ile masz danych i jak są dystrybuowane. Czy istnieją odejścia? Jak zostały wygenerowane i co oznaczają? Czy istnieją zduplikowane rekordy?
Obsługa brakujących wartości
Brakujące wartości mogą mieć wpływ na wyniki na wiele sposobów. Na przykład prawie wszystkie metody statystyczne odrzucają przypadki odrzucania z brakującymi wartościami. Domyślnie program Machine Learning następujące reguły, gdy napotka wiersze z brakującymi wartościami:
Jeśli w danych używanych do trenowania modelu brakuje wartości, wszystkie wiersze z brakującymi wartościami zostaną pominięte.
Jeśli dane używane jako dane wejściowe podczas oceniania modelu mają brakujące wartości, brakujące wartości są używane jako dane wejściowe, ale wartości null są propagowane. Zwykle oznacza to, że w wynikach jest wstawiana wartość null zamiast prawidłowego przewidywania.
Pamiętaj, aby sprawdzić dane przed trenowaniem modelu. Aby wywłaścić brakujące wartości lub poprawić dane, użyj tego modułu:
Wybieranie cech i zmniejszanie wymiarowości
Machine Learning Studio (klasyczne) może pomóc w przesyłaniach danych w celu znalezienia najbardziej przydatnych atrybutów.
Aby określić, które kolumny danych mają najbardziej predykcyjną moc, użyj narzędzi, takich jak Linear Discriminant Analysis (Analiza liniowa systemu Dorsch linear Discriminant Analysis) lub Filter Based Feature Selection (Wybór funkcji opartych na filtrach). Te narzędzia mogą również identyfikować kolumny, które powinny zostać usunięte z powodu wycieku danych.
Tworzenie lub tworzenie funkcji inżynierów z istniejących danych. Normalizujdane lub grupuj je w pojemniki, aby ująć nowe grupy danych, lub standaryzuj zakres wartości liczbowych przed analizą.
Zmniejsz wymiarowość , grupując wartości podzielone na grupy, używając analizy głównych składników lub próbkując.
Przykłady
Przykłady uczenia maszynowego w działaniu można znaleźć w Azure AI Gallery.
Aby uzyskać porady i wskazówki dotyczące niektórych typowych zadań związanych z prepration danych, zobacz Wskazówki dotyczące wykonywania zespołowego procesu nauki o danych.