Clustermodel trainen
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Traint een clusteringmodel en wijst gegevens uit de trainingsset toe aan clusters
Categorie: Machine Learning/trainen
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Clusteringmodel trainen in Machine Learning Studio (klassiek) gebruikt om een clusteringmodel te trainen.
De module maakt gebruik van een ongetraind clusteringmodel dat u al hebt geconfigureerd met behulp van de K-Means-clusteringmodule en traint het model met behulp van een gelabelde of niet-gelabelde gegevensset. De module maakt zowel een getraind model dat u kunt gebruiken voor voorspelling als een set clustertoewijzingen voor elk geval in de trainingsgegevens.
Notitie
Een clusteringmodel kan niet worden getraind met behulp van de module Train Model . Dit is de algemene module voor het maken van machine learning modellen. Dat komt doordat Train Model alleen werkt met leeralgoritmen onder supervisie. K-means en andere clusteringalgoritmen maken leren zonder supermoed mogelijk, wat betekent dat het algoritme kan leren van niet-gelabelde gegevens.
Clusteringmodel trainen gebruiken
Voeg de module Clusteringmodel trainen toe aan uw experiment in Studio (klassiek). U vindt de module onder Machine Learning Modules, in de categorie Trainen.
Voeg de K-Means Clustering-module of een andere aangepaste module toe die een compatibel clusteringmodel maakt en stel de parameters van het clusteringmodel in.
Koppel een trainingsset aan de rechterinvoer van Train Clustering Model.
Selecteer in Kolomset de kolommen uit de gegevensset die u wilt gebruiken bij het bouwen van clusters. Zorg ervoor dat u kolommen selecteert die goede functies bieden. Vermijd bijvoorbeeld het gebruik van de -ID's of andere kolommen met unieke waarden, of kolommen met dezelfde waarden.
Als een label beschikbaar is, kunt u het gebruiken als een functie of het weg laten.
Selecteer de optie Controleren op alleen resultaat of schakel het selectievakje Alleen resultaat uit als u de trainingsgegevens samen met het nieuwe clusterlabel wilt laten werken.
Als u deze optie deselecteert, worden alleen de clustertoewijzingen uitgevoerd.
Voer het experiment uit of klik op de module Clusteringmodel trainen en selecteer Geselecteerde uitvoeren.
Resultaten
Nadat de training is voltooid:
Als u het cluster en hun scheiding in een grafiek wilt weergeven, klikt u met de rechtermuisknop op de uitvoer van de gegevensset Resultaten en selecteert u Visualiseren.
De grafiek vertegenwoordigt de belangrijkste onderdelen van het cluster, in plaats van de werkelijke waarden. Zie Analyse van principal-onderdelen voor meer informatie.
Als u de waarden in de gegevensset wilt weergeven, voegt u een exemplaar van de module Converteren naar gegevensset toe en verbindt u deze met de uitvoer van de resultatenset . Voer de module Converteren naar gegevensset uit om een kopie op te halen van de gegevens die u kunt bekijken of downloaden.
Als u het getrainde model wilt opslaan voor later gebruik, klikt u met de rechtermuisknop op de module, selecteert u Getraind model en klikt u op Opslaan als getraind model.
Als u scores van het model wilt genereren, gebruikt u Gegevens toewijzen aan clusters.
Voorbeelden
Voor een voorbeeld van hoe clustering wordt gebruikt in machine learning, zie de Azure AI Gallery:
Clustering: Vergelijkbare bedrijven zoeken: demonstreert hoe u clustering gebruikt voor kenmerken die zijn afgeleid van ongestructureerde tekst.
Clustering: Kleur kwantisatie: demonstreert hoe u clustering gebruikt om gerelateerde kleuren te vinden en het aantal bits te verminderen dat in afbeeldingen wordt gebruikt.
Clustering: Irisgegevens groeperen: Biedt een eenvoudig voorbeeld van clustering op basis van de irisgegevensset.
Verwachte invoer
Naam | Type | Description |
---|---|---|
Niet-getraind model | ICluster-interface | Niet-getraind clusteringmodel |
Gegevensset | Gegevenstabel | Invoergegevensbron |
Moduleparameters
Name | Bereik | Type | Standaard | Beschrijving |
---|---|---|---|---|
Kolomset | alle | ColumnSelection | Patroon kolomselectie | |
Controleren op Alleen resultaat in- of uitvinken | alle | Booleaans | true | Of de uitvoerset een invoerset moet bevatten die is toegevoegd aan de kolom Toewijzingen (Ingeschakeld) of alleen de kolom Toewijzingen (Uitgeschakeld) |
Uitvoerwaarden
Naam | Type | Description |
---|---|---|
Getraind model | ICluster-interface | Getraind clusteringmodel |
Gegevensset met resultaten | Gegevenstabel | Invoergegevensset toegevoegd aan gegevenskolom met alleen toewijzingen of toewijzingenkolom |
Uitzonderingen
Uitzondering | Description |
---|---|
Fout 0003 | Uitzondering treedt op als een of meer invoer null of leeg zijn. |
Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).
Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.
Zie ook
Lijst met A-Z-modules
Trainen
Gegevens aan cluster toewijzen
K-means-clustering