Ontwerp voor opnieuw trainen
Bij het voorbereiden van uw model voor productie in een MLOps-oplossing (Machine Learning Operations), moet u ontwerpen voor opnieuw trainen.
Over het algemeen zijn er twee benaderingen wanneer u een model opnieuw wilt trainen:
- Op basis van een schema: wanneer u weet dat u altijd de nieuwste versie van het model nodig hebt, kunt u besluiten om uw model elke week of elke maand opnieuw te trainen op basis van een schema.
- Op basis van metrische gegevens: als u uw model alleen opnieuw wilt trainen wanneer dat nodig is, kunt u de prestaties en gegevensdrift van het model controleren om te bepalen wanneer u het model opnieuw moet trainen.
In beide gevallen moet u ontwerpen voor opnieuw trainen. Als u uw model eenvoudig opnieuw wilt trainen, moet u uw code voorbereiden voor automatisering.
Uw code voorbereiden
In het ideale geval moet u modellen trainen met scripts in plaats van notebooks. Scripts zijn beter geschikt voor automatisering. U kunt parameters toevoegen aan een script en invoerparameters wijzigen, zoals de trainingsgegevens of hyperparameterwaarden. Wanneer u uw scripts parameteriseert, kunt u het model eenvoudig opnieuw trainen op nieuwe gegevens, indien nodig.
Een ander belangrijk punt om uw code voor te bereiden, is door de code in een centrale opslagplaats te hosten. Een opslagplaats verwijst naar een locatie waar alle relevante bestanden naar een project worden opgeslagen. Met machine learning-projecten zijn git-opslagplaatsen ideaal om broncodebeheer te bereiken.
Wanneer u broncodebeheer toepast op uw project, kunt u eenvoudig samenwerken aan een project. U kunt iemand toewijzen om het model te verbeteren door de code bij te werken. U kunt eerdere wijzigingen bekijken en u kunt wijzigingen bekijken voordat ze worden doorgevoerd in de hoofdopslagplaats.
Uw code automatiseren
Wanneer u uw code automatisch wilt uitvoeren, kunt u Azure Machine Learning-taken configureren om scripts uit te voeren. In Azure Machine Learning kunt u ook pijplijnen maken en plannen om scripts uit te voeren.
Als u scripts wilt uitvoeren op basis van een trigger of gebeurtenis buiten Azure Machine Learning, kunt u de Azure Machine Learning-taak activeren vanuit een ander hulpprogramma.
Twee hulpprogramma's die vaak worden gebruikt in MLOps-projecten zijn Azure DevOps en GitHub (Actions). Met beide hulpprogramma's kunt u automatiseringspijplijnen maken en Azure Machine Learning-pijplijnen activeren.
Als data scientist werkt u mogelijk liever met de Azure Machine Learning Python SDK. Wanneer u echter werkt met hulpprogramma's zoals Azure DevOps en GitHub, kunt u liever de benodigde resources en taken configureren met de Azure Machine Learning CLI-extensie. De Azure CLI is ontworpen voor het automatiseren van taken en is mogelijk eenvoudiger te gebruiken met Azure DevOps en GitHub.
Tip
Als u meer wilt weten over MLOps, bekijkt u de inleiding tot machine learning-bewerkingen (MLOps) of probeert u uw eerste MLOps-automatiseringspijplijn te bouwen met GitHub Actions