Inleiding

Voltooid

Als u waardevolle inzichten wilt krijgen uit uw gegevens, kunt u een machine learning-model trainen met behulp van gegevenswetenschap. Als data scientist bent u misschien bekend met het gebruik van opensource-frameworks zoals scikit-learn en TensorFlow om modellen te trainen. Microsoft Fabric biedt een vertrouwde notebookervaring waarmee u uw modellen kunt trainen en integreren met het opensource-framework MLflow om uw modellen eenvoudig te volgen en te beheren.

Inzicht in het data science-proces

Een data science-project omvat doorgaans de volgende fasen:

Diagram of sequential steps in the data science process.

  1. Definieer het probleem: bepaal samen met zakelijke gebruikers en analisten wat het model moet voorspellen en wanneer het succesvol is.
  2. Haal de gegevens op: Zoek gegevensbronnen en krijg toegang door uw gegevens op te slaan in een lakehouse.
  3. De gegevens voorbereiden: verken de gegevens door deze vanuit een lakehouse in een notebook te lezen. Schoon en transformeer de gegevens op basis van de vereisten van het model.
  4. Het model trainen: Kies een algoritme en hyperparameterwaarden op basis van de evaluatie en fout door uw experimenten bij te houden met MLflow.
  5. Voorspellingen genereren: modelbatchscore gebruiken om de aangevraagde voorspellingen te genereren.

In deze module richt u zich op het trainen en volgen van het model. Als u in een notebook in Microsoft Fabric werkt, werkt u met Python om een model te trainen. U leert hoe u MLflow gebruikt om uw machine learning-modellen en hun metagegevens bij te houden. Ten slotte verkent u uw modellen met behulp van de MLflow-bibliotheek en de gebruikersinterface van Microsoft Fabric.