Inleiding
Als u waardevolle inzichten wilt krijgen uit uw gegevens, kunt u een machine learning-model trainen met behulp van gegevenswetenschap. Als data scientist bent u misschien bekend met het gebruik van opensource-frameworks zoals scikit-learn en TensorFlow om modellen te trainen. Microsoft Fabric biedt een vertrouwde notebookervaring waarmee u uw modellen kunt trainen en integreren met het opensource-framework MLflow om uw modellen eenvoudig te volgen en te beheren.
Inzicht in het data science-proces
Een data science-project omvat doorgaans de volgende fasen:
- Definieer het probleem: bepaal samen met zakelijke gebruikers en analisten wat het model moet voorspellen en wanneer het succesvol is.
- Haal de gegevens op: Zoek gegevensbronnen en krijg toegang door uw gegevens op te slaan in een lakehouse.
- De gegevens voorbereiden: verken de gegevens door deze vanuit een lakehouse in een notebook te lezen. Schoon en transformeer de gegevens op basis van de vereisten van het model.
- Het model trainen: Kies een algoritme en hyperparameterwaarden op basis van de evaluatie en fout door uw experimenten bij te houden met MLflow.
- Voorspellingen genereren: modelbatchscore gebruiken om de aangevraagde voorspellingen te genereren.
In deze module richt u zich op het trainen en volgen van het model. Als u in een notebook in Microsoft Fabric werkt, werkt u met Python om een model te trainen. U leert hoe u MLflow gebruikt om uw machine learning-modellen en hun metagegevens bij te houden. Ten slotte verkent u uw modellen met behulp van de MLflow-bibliotheek en de gebruikersinterface van Microsoft Fabric.