Välja kolumntranformering
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Skapar en transformering som väljer samma delmängd av kolumner som i den angivna datauppsättningen
Kategori: Datatransformering/manipulering
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
I den här artikeln beskrivs hur du använder modulen Välj kolumntransform i Machine Learning Studio (klassisk). Syftet med modulen Select Columns Transform (Välj transformering av kolumner) är att säkerställa att en förutsägbar, konsekvent uppsättning kolumner alltid används i underordnade maskininlärningsåtgärder.
Den här modulen är särskilt användbar för uppgifter som bedömning, som kräver specifika kolumner. Ändringar i de tillgängliga kolumnerna kan bryta experimentet eller ändra resultatet.
Du kan använda Transformeringen Välj kolumner för att skapa och spara en uppsättning kolumner. Använd sedan modulen Tillämpa transformering för att tillämpa dessa val på nya data.
Så här använder du Select Columns Transform
Det här scenariot förutsätter att du tänker använda funktionsval för att generera en dynamisk uppsättning kolumner som ska användas för att träna en modell. För att säkerställa att kolumnval är samma för bedömningsprocessen använder du modulen Välj kolumntransform för att samla in kolumnval och tillämpa dem någon annanstans i experimentet.
Lägg till en indatauppsättning i experimentet i Studio (klassisk).
Lägg till en instans av filterbaserat funktionsval.
Anslut modulerna och konfigurera modulen för funktionsval för att automatiskt hitta några av de bästa funktionerna i indatauppsättningen.
Lägg till en instans av Träningsmodell och använd utdata från Filterbaserat funktionsval som indata för träning.
Viktigt
Eftersom funktionens prioritet bestäms baserat på värdena i kolumnen kan du inte i förväg veta vilka kolumner som kan vara tillgängliga för indata till Träna modell.
Bifoga nu en instans av modulen Select Columns Transform (Välj kolumntransform ).
Detta genererar en kolumnmarkering som en transformering som kan sparas eller tillämpas på andra datauppsättningar. Det här steget säkerställer att de kolumner som identifieras av funktionsval sparas för återanvändning av andra moduler.
Lägg till modulen Poängmodell .
Anslut inte indatauppsättningen.
Lägg i stället till modulen Tillämpa transformering och anslut utdata från funktionsvalsomvandlingen.
Viktigt
Du kan inte förvänta dig att tillämpa filterbaserat funktionsval på bedömningsdatauppsättningen och få samma resultat. Eftersom funktionsvalet baseras på värden kan den välja en annan uppsättning kolumner, vilket skulle leda till att bedömningsåtgärden misslyckas.
Kör experimentet.
Den här processen för att spara och sedan tillämpa en kolumnmarkering säkerställer att samma dataschema är tillgängligt för träning och bedömning.
Exempel
Exempel på hur du använder den här modulen finns i Azure AI Gallery:
Transformera kolumner: En fullständig genomgång som använder den här modulen.
Filtrera funktioner och ta bort dem från bedömningsindata: Spara det här experimentet på arbetsytan för att se hur modulen används i ett fullständigt experimentellt arbetsflöde.
Förväntade indata
Namn | Typ | Description |
---|---|---|
Datauppsättning med önskade kolumner | Datatabell | Datauppsättning som innehåller önskad uppsättning kolumner |
Utdata
Namn | Typ | Description |
---|---|---|
Omvandling av kolumnval | ITransform-gränssnitt | Transformering som väljer samma delmängd av kolumner som i den angivna datauppsättningen. |
Undantag
Undantag | Description |
---|---|
Fel 0003 | Undantag inträffar om en eller flera indata är null eller tomma. |