Komponent: Tilldela data till kluster
Den här artikeln beskriver hur du använder komponenten Tilldela data till kluster i Azure Machine Learning-designern. Komponenten genererar förutsägelser via en klustringsmodell som tränats med K-means-klustringsalgoritmen.
Komponenten Tilldela data till kluster returnerar en datauppsättning som innehåller de troliga tilldelningarna för varje ny datapunkt.
Så här använder du Tilldela data till kluster
Leta upp en tidigare tränad klustermodell i Azure Machine Learning-designern. Du kan skapa och träna en klustermodell med någon av följande metoder:
Konfigurera K-means-klustringsalgoritmen med hjälp av K-Means-klustringskomponenten och träna modellen med hjälp av en datauppsättning och komponenten Train Clustering Model (den här artikeln).
Du kan också lägga till en befintlig tränad klustermodell från gruppen Sparade modeller på din arbetsyta.
Koppla den tränade modellen till den vänstra indataporten för Tilldela data till kluster.
Bifoga en ny datauppsättning som indata.
I den här datamängden är etiketter valfria. I allmänhet är klustring en oövervakad inlärningsmetod. Du förväntas inte känna till kategorierna i förväg. Indatakolumnerna måste dock vara samma som kolumnerna som användes för att träna klustringsmodellen, eller så uppstår ett fel.
Dricks
Om du vill minska antalet kolumner som skrivs till designern från klusterförutsägelserna använder du Välj kolumner i datamängden och väljer en delmängd av kolumnerna.
Låt kryssrutan Sök efter tillägg eller avmarkera endast resultat vara markerad om du vill att resultatet ska innehålla den fullständiga indatauppsättningen, inklusive en kolumn som visar resultatet (klustertilldelningar).
Om du avmarkerar den här kryssrutan returneras endast resultatet. Det här alternativet kan vara användbart när du skapar förutsägelser som en del av en webbtjänst.
Skicka pipelinen.
Resultat
- Om du vill visa värdena i datauppsättningen högerklickar du på komponenten och väljer sedan Visualisera. Eller Välj komponenten och växla till fliken Utdata i den högra panelen, klicka på histogramikonen i portutdata för att visualisera resultatet.