Gegevens aan cluster toewijzen
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Wijst gegevens toe aan clusters met behulp van een bestaand getraind clusteringmodel
Categorie: Score
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Gegevens toewijzen aan clusters in Machine Learning Studio (klassiek) gebruikt om voorspellingen te genereren met behulp van een clusteringmodel dat is getraind met behulp van het K-Means-clusteringalgoritme.
De module retourneert een gegevensset die de waarschijnlijke toewijzingen voor elk nieuw gegevenspunt bevat. Er wordt ook een PCA-grafiek (Principal Component Analysis) gemaakt om u te helpen de dimensionaliteit van de clusters te visualiseren.
Waarschuwing
Deze module vervangt de module Toewijzen aan clusters (afgeschaft), die alleen beschikbaar is voor ondersteuning van oudere experimenten.
Gegevens toewijzen aan clusters gebruiken
Zoek Machine Learning Studio (klassiek) een eerder getraind clusteringmodel. U kunt een clusteringmodel maken en trainen met behulp van een van deze methoden:
Configureer het K-means-algoritme met behulp van de K-Means Clustering-module en train het model vervolgens met behulp van een gegevensset en de module Clusteringmodel trainen.
Configureer een reeks opties voor het K-means-algoritme met behulp van K-Means-clustering en train het model vervolgens met behulp van de clusteringmodule Opsommen .
U kunt ook een bestaand getraind clusteringmodel toevoegen vanuit de groep Opgeslagen modellen in uw werkruimte.
Koppel het getrainde model aan de linkerinvoerpoort van Gegevens toewijzen aan clusters.
Voeg een nieuwe gegevensset toe als invoer. In deze gegevensset zijn labels optioneel. Over het algemeen is clustering een leermethode zonder supermomenten, dus het is niet verwacht dat u van tevoren categorieën kent.
De invoerkolommen moeten echter hetzelfde zijn als de kolommen die zijn gebruikt bij het trainen van het clusteringmodel, anders treedt er een fout op.
Tip
Als u het aantal kolommen van clustervoorspellingen wilt verminderen, gebruikt u Kolommen in gegevensset selecteren en selecteert u een subset van de kolommen.
Laat de optie Controleren op Toevoegen of Selectievakje voor Alleen resultaat uit als u wilt dat de resultaten de volledige invoerset bevatten, samen met een kolom die de resultaten aangeeft (clustertoewijzingen).
Als u deze optie deselecteert, krijgt u alleen de resultaten terug. Dit kan handig zijn bij het maken van voorspellingen als onderdeel van een webservice.
Voer het experiment uit.
Resultaten
De module Gegevens toewijzen aan clusters retourneert twee soorten resultaten in de uitvoer van de resultatengegevensset :
Als u de scheiding van clusters in het model wilt zien, klikt u op de uitvoer van de module en selecteert u Visualize
Met deze opdracht wordt een PCA-grafiek (Principal Component Analysis) weergegeven die de verzameling waarden in elk cluster toekent aan twee onderdeelassen.
- De eerste onderdeelas is de gecombineerde set functies die de meeste afwijking in het model vast legt. Deze wordt uitgezet op de x-as (Principal Component 1).
- De volgende onderdeelas vertegenwoordigt een gecombineerde set functies die een zijhoek heeft van het eerste onderdeel en die de volgende meeste informatie aan de grafiek toevoegt. Deze wordt uitgezet op de y-as (Principal Component 2).
In de grafiek ziet u de scheiding tussen de clusters en hoe de clusters worden verdeeld over de assen die de belangrijkste onderdelen vertegenwoordigen.
Als u de tabel met resultaten voor elk geval in de invoergegevens wilt weergeven, koppelt u de module Converteren naar gegevensset en visualiseert u de resultaten in Studio (klassiek).
Deze gegevensset bevat de clustertoewijzingen voor elk geval en een metrische afstandsmetrische gegevens die u een indicatie geven van hoe dicht dit specifieke geval bij het midden van het cluster ligt.
Naam van uitvoerkolom Description Toewijzingen Een op 0 gebaseerde index die aangeeft aan welk cluster het gegevenspunt is toegewezen. DistancesToClusterCenter no. n Voor elk gegevenspunt geeft deze waarde de afstand aan van het gegevenspunt naar het midden van het toegewezen cluster en de afstand tot andere clusters.
De metrische gegevens die worden gebruikt om de afstand te berekenen, worden bepaald wanneer u het K-means-clusteringmodel configureert.
Verwachte invoer
Naam | Type | Description |
---|---|---|
Getraind model | ICluster-interface | Getraind clusteringmodel |
Gegevensset | Gegevenstabel | Invoergegevensbron |
Moduleparameters
Naam | Type | Bereik | Optioneel | Standaard | Beschrijving |
---|---|---|---|---|---|
Alleen resultaat of app-resultaat | Vereist | TRUE | Geef aan of de uitvoerset zowel de invoerset als de resultaten moet bevatten, of alleen de resultaten | ||
Parameterparameterparametermodus opgeven | Opruimmethoden | Lijst:Volledig raster| Willekeurige opsruiming | Vereist | Willekeurige opsruiming | Hele raster op parameterruimte doorzoeken of opsampen met behulp van een beperkt aantal voorbeeld runs |
Uitvoerwaarden
Naam | Type | Description |
---|---|---|
Gegevensset met resultaten | Gegevenstabel | Invoergegevensset toegevoegd aan gegevenskolom met alleen toewijzingen of toewijzingenkolom |
Uitzonderingen
Uitzondering | Description |
---|---|
Fout 0003 | Uitzondering treedt op als een of meer invoer null of leeg zijn. |