Tutorial: End-to-End-ML-Modelle in Azure Databricks
Das maschinelle Lernen in der realen Welt gestaltet sich chaotisch. Datenquellen enthalten fehlende Werte, redundante Zeilen oder passen möglicherweise nicht in den Arbeitsspeicher. Feature Engineering erfordert häufig Domänenkenntnisse und kann mühsam sein. Bei der Modellierung werden allzu häufig Datenwissenschaft und Systemtechnik vermischt, was nicht nur Kenntnisse über Algorithmen, sondern auch über Maschinenarchitektur und verteilte Systeme voraussetzt.
Azure Databricks vereinfacht diesen Prozess. Das folgende 10-minütige Tutorial-Notebook zeigt ein End-to-End-Beispiel für das Trainieren von Machine Learning-Modellen für Tabellendaten.
Sie können dieses Notebook importieren und selbst ausführen oder Codeausschnitte und Ideen für Ihre eigene Verwendung kopieren.
Notebook
Wenn Ihr Arbeitsbereich für Unity Catalog aktiviert ist, verwenden Sie diese Version des Notebooks:
Verwenden von scikit-learn mit MLflow-Integration in Databricks (Unity Catalog)
Wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert ist, verwenden Sie diese Version des Notebooks: