Trenowanie modelu klastrowania
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Trenowanie modelu klastrowania i przypisywanie danych z zestawu treningowego do klastrów
Kategoria: Machine Learning / Trenuj
Uwaga
Dotyczy: tylko Machine Learning Studio (klasyczne)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano, jak używać modułu Train Clustering Model (Trenowanie modelu klastrowania) w programie Machine Learning Studio (wersja klasyczna) do trenowania modelu klastrowania.
Moduł przyjmuje nie wytrenowany model klastrowania, który został już skonfigurowany przy użyciu modułu klastrowania k-węzłów , i szkoli model przy użyciu zestawu danych z etykietami lub bez etykiet. Moduł tworzy zarówno wytrenowany model, który umożliwia przewidywanie, jak i zestaw przypisań klastrów dla każdego przypadku w danych szkoleniowych.
Uwaga
Nie można wytrenować modelu klastrowania przy użyciu modułu Train Model (Trenowanie modelu), który jest ogólnym modułem tworzenia modeli uczenia maszynowego. Wynika to z tego, że trenowanie modelu działa tylko z algorytmami uczenia nadzorowanego. Algorytmy k-węzłów i inne algorytmy klastrowania umożliwiają uczenie bez nadzoru, co oznacza, że algorytm może uczyć się na podstawie danych bez etykiet.
Jak używać trenowania modelu klastrowania
Dodaj moduł Train Clustering Model (Trenowanie modelu klastrowania ) do eksperymentu w programie Studio (wersja klasyczna). Moduł można znaleźć w obszarze Machine Learning Modules (Moduły) w kategorii Train (Trenuj).
Dodaj moduł klastrowania k-węzłów lub inny moduł niestandardowy, który tworzy zgodny model klastrowania i ustawia parametry modelu klastrowania.
Dołącz zestaw danych treningowych do danych wejściowych po prawej stronie w sekcji Train Clustering Model (Trenowanie modelu klastrowania).
W zestawie kolumn wybierz kolumny z zestawu danych do użycia podczas tworzenia klastrów. Pamiętaj, aby wybrać kolumny, które mają dobre cechy: na przykład unikaj używania identyfikatorów lub innych kolumn, które mają unikatowe wartości, lub kolumn, które mają te same wartości.
Jeśli etykieta jest dostępna, możesz użyć jej jako funkcji lub pozostawić ją na zewnątrz.
Wybierz opcję Sprawdź dołącz lub Usuń zaznaczenie dla pozycji Tylko wynik, jeśli chcesz wyprowadzić dane treningowe wraz z nową etykietą klastra.
Usunięcie zaznaczenia tej opcji spowoduje usunięcie zaznaczenia tylko przypisań klastra.
Uruchom eksperyment lub kliknij moduł Train Clustering Model (Trenowanie modelu klastrowania ) i wybierz pozycję Run Selected (Uruchom wybrane).
Wyniki
Po zakończeniu szkolenia:
Aby wyświetlić klaster i jego separację na wykresie, kliknij prawym przyciskiem myszy dane wyjściowe zestawu danych Results i wybierz pozycję Visualize (Wizualizacja).
Wykres reprezentuje główne składniki klastra, a nie rzeczywiste wartości. Aby uzyskać więcej informacji, zobacz Analiza głównych składników.
Aby wyświetlić wartości w zestawie danych, dodaj wystąpienie modułu Convert to Dataset (Konwertuj na zestaw danych) i połącz je z wyjściem zestawu danych Results (Wyniki). Uruchom moduł Konwertuj na zestaw danych, aby uzyskać kopię danych, które można wyświetlić lub pobrać.
Aby zapisać wytrenowany model do późniejszego ponownego użycia, kliknij prawym przyciskiem myszy moduł, wybierz pozycję Wytrenowany model, a następnie kliknij pozycję Zapisz jako wytrenowany model.
Aby wygenerować wyniki z modelu, użyj funkcji Przypisz dane do klastrów.
Przykłady
Aby uzyskać przykład sposobu, w jaki klastrowanie jest używane w uczeniu maszynowym, zobacz Azure AI Gallery:
Klastrowanie: Znajdź podobne firmy: Pokazuje, jak używać klastrowania na atrybutach pochodzących z tekstu bez struktury.
Klastrowanie: kwantyzacja kolorów: pokazuje, jak używać klastrowania w celu znalezienia powiązanych kolorów i zmniejszenia liczby bitów używanych na obrazach.
Klastrowanie: grupowanie danych irysów: prosty przykład klastrowania na podstawie zestawu danych irysów.
Oczekiwane dane wejściowe
Nazwa | Typ | Opis |
---|---|---|
Nie wytrenowany model | ICluster, interfejs | Nieprzeszkolony model klastrowania |
Zestaw danych | Tabela danych | Wejściowe źródło danych |
Parametry modułu
Nazwa | Zakres | Typ | Domyślny | Opis |
---|---|---|---|---|
Zestaw kolumn | dowolny | ColumnSelection | Wzorzec wyboru kolumny | |
Sprawdzanie opcji Dołącz lub Usuń zaznaczenie tylko wyniku | dowolny | Wartość logiczna | true | Określa, czy wyjściowy zestaw danych musi zawierać wejściowy zestaw danych dołączany przez kolumnę przypisań (zaznaczone), czy tylko kolumnę przypisań (niezaznaczone) |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Wytrenowany model | ICluster, interfejs | Wytrenowany model klastrowania |
Zestaw danych wyników | Tabela danych | Wejściowy zestaw danych dołączany tylko do kolumny danych przypisań lub przypisań |
Wyjątki
Wyjątek | Opis |
---|---|
Błąd 0003 | Wyjątek występuje, jeśli co najmniej jeden z danych wejściowych ma wartość null lub jest pusty. |
Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.
Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).
Zobacz też
Lista modułów A–Z
Szkolenie
Przypisywanie danych do klastrów
Klastrowanie metodą k-średnich