Machine learning-modules in ML Studio-modules (klassiek)
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
De gebruikelijke werkstroom voor machine learning bestaat uit veel fasen:
Het identificeren van een probleem dat moet worden opgelost en een metrische gegevens voor het meten van resultaten.
De juiste gegevens zoeken, ops manier ops manier ops manier voorbereiden.
De beste functies en technische nieuwe functies identificeren.
Modellen bouwen, evalueren en afstemmen.
Modellen gebruiken om voorspellingen, aanbevelingen en andere resultaten te genereren.
De modules in deze sectie bieden hulpprogramma's voor de laatste fasen van machine learning, waarin u een algoritme op gegevens kunt toepassen om een model te trainen. In deze laatste fasen genereert u ook scores en evalueert u vervolgens de nauwkeurigheid en het nut van het model.
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Lijst met machine learning taken per categorie
-
Kies uit verschillende aanpasbare machine learning algoritmen, waaronder modellen voor clustering, regressie, classificatie en anomaliedetectie.
-
Geef uw gegevens op aan het geconfigureerde model om te leren van patronen en statistieken te maken die kunnen worden gebruikt voor voorspellingen.
-
Maak voorspellingen met behulp van de getrainde modellen.
-
Meet de nauwkeurigheid van een getraind model of vergelijk meerdere modellen.
Zie de walkthrough over kredietrisico's voor een gedetailleerde beschrijving van deze experimentele werkstroom.
Vereisten
Voordat u aan het leuke deel van het bouwen van een model kunt komen, is meestal veel voorbereiding vereist. Deze sectie bevat koppelingen naar hulpprogramma's in Machine Learning Studio (klassiek) waarmee u uw gegevens kunt ops schonen, de kwaliteit van invoer kunt verbeteren en runtimefouten kunt voorkomen.
Gegevensverkenning en gegevenskwaliteit
Zorg ervoor dat uw gegevens het juiste soort gegevens zijn, de juiste hoeveelheid en de juiste kwaliteit voor het algoritme dat u hebt gekozen. Begrijpen hoeveel gegevens u hebt en hoe deze worden gedistribueerd. Zijn er uitbijten? Hoe zijn die gegenereerd en wat betekenen ze? Zijn er dubbele records?
Ontbrekende waarden verwerken
Ontbrekende waarden kunnen uw resultaten op verschillende manieren beïnvloeden. Bijna alle statistische methoden verwijderen bijvoorbeeld cases met ontbrekende waarden. Standaard volgt Machine Learning deze regels wanneer er rijen met ontbrekende waarden worden aangetroffen:
Als gegevens die worden gebruikt om een model te trainen ontbrekende waarden bevatten, worden rijen met ontbrekende waarden overgeslagen.
Als gegevens die worden gebruikt als invoer bij het scoren op basis van een model ontbrekende waarden bevatten, worden de ontbrekende waarden gebruikt als invoer, maar worden null-waarden doorgegeven. Dit betekent meestal dat een null wordt ingevoegd in de resultaten in plaats van een geldige voorspelling.
Zorg ervoor dat u uw gegevens controleert voordat u uw model traint. Als u de ontbrekende waarden wilt toe-eigenen of uw gegevens wilt corrigeren, gebruikt u deze module:
Functies selecteren en dimensionaliteit verminderen
Machine Learning Studio (klassiek) kan u helpen bij het doorseen van uw gegevens om de meest nuttige kenmerken te vinden.
Gebruik hulpprogramma's zoals Linear Linear Discriminant Analysis of Filter Based Feature Selection om te bepalen welke kolommen met gegevens de meeste voorspellende kracht hebben. Deze hulpprogramma's kunnen ook kolommen identificeren die moeten worden verwijderd vanwege het lekken van gegevens.
Functies maken of engineeren van bestaande gegevens. Normaliseer gegevens of groeperen gegevens in bins om nieuwe groeperingen van gegevens te maken, of standaardiseer het bereik van numerieke waarden vóór de analyse.
Verklein dimensionaliteit door categorische waarden te groeperen, door analyse van hoofdcomponenten of steekproeven te gebruiken.
Voorbeelden
Zie de machine learning voor voorbeelden van Azure AI Gallery.
Zie Walkthroughs executing the Team Data Science Process (Walkthroughs voor het uitvoeren van het Team Data Science Process) voor tips en een overzicht van een aantal typische taken voor gegevensvoorbereiding.