Datatransformering – skala och minska
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
I den här artikeln beskrivs modulerna i Machine Learning Studio (klassisk) som kan hjälpa dig att arbeta med numeriska data. För maskininlärning omfattar vanliga datauppgifter cklippning, data binering och normalisering av numeriska värden. Andra moduler stöder minskning av antalet dimensioner.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Modellera numeriska data
Uppgifter som normalisering, datalagerering eller omfördelning av numeriska variabler är en viktig del av dataförberedelse för maskininlärning. Modulerna i den här gruppen stöder följande uppgifter för förberedelse av data:
- Gruppera data i lagerplatser med olika storlekar eller distributioner.
- Ta bort avvikande värden eller ändra deras värden.
- Normalisera en uppsättning numeriska värden till ett visst intervall.
- Skapa en kompakt uppsättning funktionskolumner från en datauppsättning med hög dimension.
Relaterade uppgifter
- Välj relevanta och användbara funktioner som du kan använda när du skapar modellen: Använd modulerna Funktionsval eller Fisher Linear Discriminant Analysis.
- Välj funktioner baserat på antal värden: Använd modulen Learning med antal.
- Ta bort eller ersätt saknade värden: Använd modulen Rensa data som saknas .
- Ersätt kategoriska värden med numeriska värden som härleds från beräkningar: Använd modulen Ersätt diskreta värden.
- Beräkna en sannolikhetsfördelning för diskreta eller numeriska kolumner: Använd modulen Utvärdera sannolikhetsfunktion .
- Filtrera och transformera digitala signaler och vågforms: Använd modulen Filter.
Lista över moduler
Den här kategorin för datatransformering – skala och minska innehåller följande moduler:
- Clip Values (Clip-värden): Identifierar avvikande värden och klipper sedan ut eller ersätter deras värden.
- Gruppera data i lagerplatser: Placerar numeriska data i lagerplatser.
- Normalisera data: Skalar om numeriska data för att begränsa datauppsättningsvärden till ett standardintervall.
- Analys av huvudkomponenter: Beräknar en uppsättning funktioner som har minskad dimensionalitet för effektivare inlärning.