Trainieren und Bewerten von Modellen mit Microsoft Fabric
Wenn Sie Ihre Daten erfasst, untersucht und vorverarbeitet haben, können Sie damit ein Modell trainieren. Das Trainieren eines Modells ist ein iterativer Prozess, und Sie sollten Ihre Arbeit dabei nachverfolgen können.
Microsoft Fabric ist in MLflow integriert, damit Sie Ihre Arbeitsschritte einfach nachverfolgen und protokollieren können. So können Sie Ihre Arbeit jederzeit überprüfen und entscheiden, was der beste Ansatz zum Trainieren des endgültigen Modells ist. Wenn Sie Ihre Arbeit nachverfolgen, sind Ihre Ergebnisse leicht reproduzierbar.
Alle Schritte, die Sie nachverfolgen möchten, können als Experimente nachverfolgt werden.
Grundlegendes zu Experimenten
Wenn Sie ein Modell in einem Notebook trainieren, das Sie nachverfolgen möchten, erstellen Sie ein Experiment in Microsoft Fabric.
Ein Experiment kann aus mehreren Ausführungen bestehen. Jede Ausführung stellt eine Aufgabe dar, die Sie in einem Notebook ausgeführt haben, z. B. das Trainieren eines Machine Learning-Modells.
Um beispielsweise ein Machine Learning-Modell für Verkaufsprognosen zu trainieren, können Sie verschiedene Trainingsdatasets mit demselben Algorithmus testen. Jedes Mal, wenn Sie ein Modell mit einem anderen Dataset trainieren, erstellen Sie eine neue Experimentausführung. Anschließend können Sie die Experimentausführungen vergleichen, um das Modell mit der besten Leistung zu ermitteln.
Nachverfolgen von Metriken
Um Experimentausführungen zu vergleichen, verfolgen Sie die Parameter, Metriken und Artefakte für jede Ausführung nach.
Alle Parameter, Metriken und Artefakte, die Sie in einer Experimentausführung nachverfolgen, werden in der Experimentübersicht angezeigt. Sie können Experimentausführungen einzeln auf der Registerkarte Ausführungsdetails anzeigen oder ausführungsübergreifend mit der Option Liste ausführen vergleichen:
Indem Sie Ihre Arbeit mit MLflow nachverfolgen, können Sie Modelltrainingsiterationen vergleichen und entscheiden, welche Konfiguration zum besten Modell für Ihren Anwendungsfall geführt hat.
Grundlegendes zu Modellen
Nachdem Sie ein Modell trainiert haben, verwenden Sie es für die Bewertung. Bei der Bewertung verwenden Sie das Modell mit neuen Daten, um Vorhersagen oder Erkenntnisse zu generieren. Wenn Sie ein Modell mit MLflow trainieren und nachverfolgen, werden Artefakte in der Experimentausführung gespeichert, um Ihr Modell und seine Metadaten darzustellen. Sie können diese Artefakte in Microsoft Fabric als Modell speichern.
Indem Sie Ihre Modellartefakte als registriertes Modell in Microsoft Fabric speichern, lassen sich Ihre Modelle problemlos verwalten. Jedes Mal, wenn Sie ein neues Modell trainieren und unter demselben Namen speichern, fügen Sie dem Modell eine neue Version hinzu.
Verwenden eines Modells zum Generieren von Erkenntnissen
Um ein Modell zum Generieren von Vorhersagen zu verwenden, können Sie die PREDICT-Funktion in Microsoft Fabric verwenden. Die PREDICT-Funktion ist für die einfache Integration in MLflow-Modelle entwickelt und ermöglicht es Ihnen, das Modell zum Generieren von Batchvorhersagen zu verwenden.
Beispielsweise erhalten Sie jede Woche Verkaufsdaten aus mehreren Läden. Mithilfe historischer Daten haben Sie ein Modell trainiert, das den Umsatz für die nächste Woche basierend auf den Verkäufen der letzten Wochen vorhersagen kann. Sie haben das Modell mit MLflow nachverfolgt und in Microsoft Fabric gespeichert. Immer wenn die neuen Umsatzdaten für eine Woche eingehen, lassen Sie das Modell mit der PREDICT-Funktion die Vorhersage für die nächste Woche generieren. Die prognostizierten Umsatzdaten werden als Tabelle in einem Lakehouse gespeichert, das für die Geschäftsbenutzer in einem Power BI-Bericht visualisiert wird.