Trenowanie modelu klastrowania

Artykuł
05/06/2019

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
Dowiedz się więcej o Azure Machine Learning.

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Trenowanie modelu klastrowania i przypisywanie danych z zestawu treningowego do klastrów

Kategoria: Machine Learning / Trenuj

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano, jak używać modułu Train Clustering Model (Trenowanie modelu klastrowania) w programie Machine Learning Studio (wersja klasyczna) do trenowania modelu klastrowania.

Moduł przyjmuje nie wytrenowany model klastrowania, który został już skonfigurowany przy użyciu modułu klastrowania k-węzłów , i szkoli model przy użyciu zestawu danych z etykietami lub bez etykiet. Moduł tworzy zarówno wytrenowany model, który umożliwia przewidywanie, jak i zestaw przypisań klastrów dla każdego przypadku w danych szkoleniowych.

Uwaga

Nie można wytrenować modelu klastrowania przy użyciu modułu Train Model (Trenowanie modelu), który jest ogólnym modułem tworzenia modeli uczenia maszynowego. Wynika to z tego, że trenowanie modelu działa tylko z algorytmami uczenia nadzorowanego. Algorytmy k-węzłów i inne algorytmy klastrowania umożliwiają uczenie bez nadzoru, co oznacza, że algorytm może uczyć się na podstawie danych bez etykiet.

Jak używać trenowania modelu klastrowania

Dodaj moduł Train Clustering Model (Trenowanie modelu klastrowania ) do eksperymentu w programie Studio (wersja klasyczna). Moduł można znaleźć w obszarze Machine Learning Modules (Moduły) w kategorii Train (Trenuj).
Dodaj moduł klastrowania k-węzłów lub inny moduł niestandardowy, który tworzy zgodny model klastrowania i ustawia parametry modelu klastrowania.
Dołącz zestaw danych treningowych do danych wejściowych po prawej stronie w sekcji Train Clustering Model (Trenowanie modelu klastrowania).
W zestawie kolumn wybierz kolumny z zestawu danych do użycia podczas tworzenia klastrów. Pamiętaj, aby wybrać kolumny, które mają dobre cechy: na przykład unikaj używania identyfikatorów lub innych kolumn, które mają unikatowe wartości, lub kolumn, które mają te same wartości.

Jeśli etykieta jest dostępna, możesz użyć jej jako funkcji lub pozostawić ją na zewnątrz.
Wybierz opcję Sprawdź dołącz lub Usuń zaznaczenie dla pozycji Tylko wynik, jeśli chcesz wyprowadzić dane treningowe wraz z nową etykietą klastra.

Usunięcie zaznaczenia tej opcji spowoduje usunięcie zaznaczenia tylko przypisań klastra.
Uruchom eksperyment lub kliknij moduł Train Clustering Model (Trenowanie modelu klastrowania ) i wybierz pozycję Run Selected (Uruchom wybrane).

Wyniki

Po zakończeniu szkolenia:

Aby wyświetlić klaster i jego separację na wykresie, kliknij prawym przyciskiem myszy dane wyjściowe zestawu danych Results i wybierz pozycję Visualize (Wizualizacja).

Wykres reprezentuje główne składniki klastra, a nie rzeczywiste wartości. Aby uzyskać więcej informacji, zobacz Analiza głównych składników.
Aby wyświetlić wartości w zestawie danych, dodaj wystąpienie modułu Convert to Dataset (Konwertuj na zestaw danych) i połącz je z wyjściem zestawu danych Results (Wyniki). Uruchom moduł Konwertuj na zestaw danych, aby uzyskać kopię danych, które można wyświetlić lub pobrać.
Aby zapisać wytrenowany model do późniejszego ponownego użycia, kliknij prawym przyciskiem myszy moduł, wybierz pozycję Wytrenowany model, a następnie kliknij pozycję Zapisz jako wytrenowany model.
Aby wygenerować wyniki z modelu, użyj funkcji Przypisz dane do klastrów.

Przykłady

Aby uzyskać przykład sposobu, w jaki klastrowanie jest używane w uczeniu maszynowym, zobacz Azure AI Gallery:

Klastrowanie: Znajdź podobne firmy: Pokazuje, jak używać klastrowania na atrybutach pochodzących z tekstu bez struktury.
Klastrowanie: kwantyzacja kolorów: pokazuje, jak używać klastrowania w celu znalezienia powiązanych kolorów i zmniejszenia liczby bitów używanych na obrazach.
Klastrowanie: grupowanie danych irysów: prosty przykład klastrowania na podstawie zestawu danych irysów.

Oczekiwane dane wejściowe

Nazwa	Typ	Opis
Nie wytrenowany model	ICluster, interfejs	Nieprzeszkolony model klastrowania
Zestaw danych	Tabela danych	Wejściowe źródło danych

Parametry modułu

Nazwa	Zakres	Typ	Domyślny	Opis
Zestaw kolumn	dowolny	ColumnSelection		Wzorzec wyboru kolumny
Sprawdzanie opcji Dołącz lub Usuń zaznaczenie tylko wyniku	dowolny	Wartość logiczna	true	Określa, czy wyjściowy zestaw danych musi zawierać wejściowy zestaw danych dołączany przez kolumnę przypisań (zaznaczone), czy tylko kolumnę przypisań (niezaznaczone)

Dane wyjściowe

Nazwa	Typ	Opis
Wytrenowany model	ICluster, interfejs	Wytrenowany model klastrowania
Zestaw danych wyników	Tabela danych	Wejściowy zestaw danych dołączany tylko do kolumny danych przypisań lub przypisań

Wyjątki

Wyjątek	Opis
Błąd 0003	Wyjątek występuje, jeśli co najmniej jeden z danych wejściowych ma wartość null lub jest pusty.

Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.

Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).

Zobacz też

Lista modułów A–Z
Szkolenie
Przypisywanie danych do klastrów
Klastrowanie metodą k-średnich

Udostępnij za pośrednictwem