Gegevenstransformatie: schalen en verminderen
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
In dit artikel worden de modules in Machine Learning Studio (klassiek) beschreven die u kunnen helpen bij het werken met numerieke gegevens. Veelvoorkomende machine learning zijn onder andere het knippen, binningen en normaliseren van numerieke waarden. Andere modules ondersteunen dimensionaliteitsvermindering.
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Numerieke gegevens modelleren
Taken zoals het normaliseren, binningen of opnieuw distribueren van numerieke variabelen zijn een belangrijk onderdeel van de gegevensvoorbereiding voor machine learning. De modules in deze groep ondersteunen de volgende gegevensvoorbereidingstaken:
- Gegevens groeperen in opslaglocaties met verschillende grootten of distributies.
- Uitbijten verwijderen of de waarden wijzigen.
- Een set numerieke waarden normaliseren in een specifiek bereik.
- Een compacte set functiekolommen maken op basis van een gegevensset met een hoge dimensie.
Gerelateerde taken
- Selecteer relevante en nuttige functies om te gebruiken bij het bouwen van het model: gebruik de modules Functieselectie of Lineaire discriminantanalyse .
- Functies selecteren op basis van het aantal waarden: gebruik de module Learning met tellingen.
- Ontbrekende waarden verwijderen of vervangen: gebruik de module Ontbrekende gegevens ops schonen.
- Categorische waarden vervangen door numerieke waarden die zijn afgeleid van berekeningen: gebruik de module Discrete waarden vervangen.
- Een waarschijnlijkheidsverdeling berekenen voor discrete of numerieke kolommen: gebruik de module Waarschijnlijkheidsfunctie evalueren.
- Digitale signalen en golfvormen filteren en transformeren: gebruik de filtermodule .
Lijst met modules
Deze categorie Gegevenstransformatie - Schalen en verminderen omvat de volgende modules:
- Waarden vastbijten: detecteert uitbijten en verfragmenteert of vervangt vervolgens de waarden.
- Gegevens groepeert u in bins: plaatst numerieke gegevens in bins.
- Gegevens normaliseren: Hiermee worden numerieke gegevens opnieuw geschaald om gegevenssetwaarden te beperken tot een standaardbereik.
- Analyse van hoofdcomponenten: Berekent een set functies met verminderde dimensionaliteit voor efficiënter leren.