Dela via


Datatransformering – manipulering

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Den här artikeln beskriver de moduler i Machine Learning Studio (klassisk) som du kan använda för grundläggande datamanipulering.

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Machine Learning Studio (klassisk) stöder uppgifter som är specifika för maskininlärning, till exempel normalisering eller funktionsval. Modulerna i den här kategorin är avsedda för mer allmänna uppgifter.

Datamanipuleringsuppgifter

Modulerna i den här kategorin är avsedda att stödja grundläggande datahanteringsuppgifter som kan behöva utföras i Machine Learning Studio (klassisk). Följande uppgifter är exempel på viktiga datahanteringsuppgifter:

  • Kombinera två datauppsättningar, antingen med hjälp av kopplingar eller genom att sammanfoga kolumner eller rader.
  • Skapa nya kategorier som ska användas för att gruppera data.
  • Ändra kolumnrubriker, ändra kolumndatatyper eller flagga kolumner som funktioner eller etiketter.
  • Sök efter saknade värden och ersätt dem sedan med lämpliga värden.

Exempel

Exempel på hur du arbetar med komplexa data i maskininlärningsexperiment finns i följande exempel i Azure AI Gallery:

Moduler i den här kategorin

Kategorin Datatransformering – Manipulering innehåller följande moduler:

  • Lägg till kolumner: Lägger till en uppsättning kolumner från en datauppsättning till en annan.
  • Lägg till rader: Lägger till en uppsättning rader från en indatauppsättning i slutet av en annan datauppsättning.
  • Tillämpa SQL transformation: Kör en SQLite-fråga på indatauppsättningar för att transformera data.
  • Rensa data som saknas: Anger hur du hanterar värden som saknas i en datauppsättning. Den här modulen ersätter Borstning av saknade värden, som har gjorts inaktuell.
  • Konvertera till indikatorvärden: Konverterar kategoriska värden i kolumner till indikatorvärden.
  • Redigera metadata: Redigerar metadata som är associerade med kolumner i en datauppsättning.
  • Gruppera kategoriska värden: Grupperar data från flera kategorier till en ny kategori.
  • Koppla data: Ansluter till två datauppsättningar.
  • Ta bort dubblettrader: Tar bort dubblettrader från en datauppsättning.
  • Välj Kolumner i datauppsättning: Väljer kolumner som ska inkluderas i en datauppsättning eller undantas från en datauppsättning i en åtgärd.
  • Välj kolumner transformera: Skapar en transformering som väljer samma delmängd av kolumner som i en angiven datauppsättning.
  • SMOTE: Ökar antalet exempel med låg förekomst i en datamängd med hjälp av syntetisk översampling av fördrampling.

Se även