Datatransformering – manipulering
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Den här artikeln beskriver de moduler i Machine Learning Studio (klassisk) som du kan använda för grundläggande datamanipulering.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Machine Learning Studio (klassisk) stöder uppgifter som är specifika för maskininlärning, till exempel normalisering eller funktionsval. Modulerna i den här kategorin är avsedda för mer allmänna uppgifter.
Datamanipuleringsuppgifter
Modulerna i den här kategorin är avsedda att stödja grundläggande datahanteringsuppgifter som kan behöva utföras i Machine Learning Studio (klassisk). Följande uppgifter är exempel på viktiga datahanteringsuppgifter:
- Kombinera två datauppsättningar, antingen med hjälp av kopplingar eller genom att sammanfoga kolumner eller rader.
- Skapa nya kategorier som ska användas för att gruppera data.
- Ändra kolumnrubriker, ändra kolumndatatyper eller flagga kolumner som funktioner eller etiketter.
- Sök efter saknade värden och ersätt dem sedan med lämpliga värden.
Relaterade uppgifter
- Utför sampling eller dela upp en datauppsättning i tränings- och testuppsättningar: Använd modulerna Datatransformering – Exempel och Dela .
- Skala tal, normalisera data eller placera numeriska värden i lagerplatser: Använd modulerna Datatransformering – Skala och Minska .
- Utför beräkningar på numeriska datafält eller för att generera vanlig statistik: Använd verktygen i Statistiska funktioner.
Exempel
Exempel på hur du arbetar med komplexa data i maskininlärningsexperiment finns i följande exempel i Azure AI Gallery:
- Databearbetning och analys: Visar viktiga verktyg och processer.
- Canceridentifiering: Visar hur du partitionar datamängder och sedan tillämpar särskild bearbetning på varje partition.
Moduler i den här kategorin
Kategorin Datatransformering – Manipulering innehåller följande moduler:
- Lägg till kolumner: Lägger till en uppsättning kolumner från en datauppsättning till en annan.
- Lägg till rader: Lägger till en uppsättning rader från en indatauppsättning i slutet av en annan datauppsättning.
- Tillämpa SQL transformation: Kör en SQLite-fråga på indatauppsättningar för att transformera data.
- Rensa data som saknas: Anger hur du hanterar värden som saknas i en datauppsättning. Den här modulen ersätter Borstning av saknade värden, som har gjorts inaktuell.
- Konvertera till indikatorvärden: Konverterar kategoriska värden i kolumner till indikatorvärden.
- Redigera metadata: Redigerar metadata som är associerade med kolumner i en datauppsättning.
- Gruppera kategoriska värden: Grupperar data från flera kategorier till en ny kategori.
- Koppla data: Ansluter till två datauppsättningar.
- Ta bort dubblettrader: Tar bort dubblettrader från en datauppsättning.
- Välj Kolumner i datauppsättning: Väljer kolumner som ska inkluderas i en datauppsättning eller undantas från en datauppsättning i en åtgärd.
- Välj kolumner transformera: Skapar en transformering som väljer samma delmängd av kolumner som i en angiven datauppsättning.
- SMOTE: Ökar antalet exempel med låg förekomst i en datamängd med hjälp av syntetisk översampling av fördrampling.