Inleiding
In machine learning worden modellen getraind om onbekende labels voor nieuwe gegevens te voorspellen op basis van correlaties tussen bekende labels en functies in de trainingsgegevens. Afhankelijk van het gebruikte algoritme moet u mogelijk hyperparameters opgeven om te configureren hoe het model wordt getraind.
Het logistieke regressiealgoritme maakt bijvoorbeeld gebruik van een regularisatiefrequentie hyperparameter om overfitting tegen te gaan; en deep learning-technieken voor convolutionele neurale netwerken (CNN's) gebruiken hyperparameters zoals leersnelheid om te bepalen hoe gewichten worden aangepast tijdens de training en batchgrootte om te bepalen hoeveel gegevensitems in elke trainingsbatch worden opgenomen.
Notitie
Machine Learning is een academisch veld met een eigen specifieke terminologie. Gegevenswetenschappers verwijzen naar de waarden die zijn bepaald op basis van de trainingsfuncties als parameters. Daarom is een andere term vereist voor waarden die worden gebruikt voor het configureren van trainingsgedrag, maar die niet zijn afgeleid van de trainingsgegevens, vandaar de term hyperparameter.
De keuze van hyperparameterwaarden kan aanzienlijk van invloed zijn op het resulterende model, waardoor het belangrijk is om de best mogelijke waarden voor uw specifieke gegevens en voorspellende prestatiedoelen te selecteren.
Hyperparameters afstemmen
Hyperparameterafstemming wordt bereikt door de meerdere modellen te trainen, met behulp van hetzelfde algoritme en trainingsgegevens, maar verschillende hyperparameterwaarden. Het resulterende model van elke trainingsuitvoering wordt vervolgens geƫvalueerd om de prestatiemetriek te bepalen waarvoor u wilt optimaliseren (bijvoorbeeld nauwkeurigheid) en het best presterende model is geselecteerd.
In Azure Machine Learning kunt u hyperparameters afstemmen door een script als een sweep-taak in te dienen. Een sweep-taak voert een proefversie uit voor elke hyperparametercombinatie die moet worden getest. Elke proefversie maakt gebruik van een trainingsscript met geparameteriseerde hyperparameterwaarden om een model te trainen en registreert de metrische doelprestaties die worden bereikt door het getrainde model.
Leerdoelen
In deze module wordt het volgende behandeld:
- Definieer een hyperparameterzoekruimte.
- Hyperparametersampling configureren.
- Selecteer een beleid voor vroegtijdige beƫindiging.
- Voer een opruimende taak uit.