Scikit-learn gebruiken in Azure Databricks
Op deze pagina vindt u voorbeelden van hoe u het scikit-learn
pakket kunt gebruiken om machine learning-modellen te trainen in Azure Databricks. scikit-learn is een van de populairste Python-bibliotheken voor machine learning met één knooppunt en is opgenomen in Databricks Runtime en Databricks Runtime ML. Zie de releaseopmerkingen voor Databricks Runtime voor de scikit-learn-bibliotheekversie die is opgenomen in de runtime van uw cluster.
U kunt deze notebooks importeren en uitvoeren in uw Azure Databricks-werkruimte.
Zie zelfstudies: Aan de slag met AI en machine learning voor aanvullende voorbeeldnotebooks om snel aan de slag te gaan met Azure Databricks.
Basisvoorbeeld met scikit-learn
Dit notebook biedt een kort overzicht van machine learning-modeltraining in Azure Databricks. Het pakket maakt gebruik van het scikit-learn
pakket om een eenvoudig classificatiemodel te trainen. Het illustreert ook het gebruik van MLflow om het modelontwikkelingsproces bij te houden en Optuna voor het automatiseren van hyperparameterafstemming.
Als uw werkruimte is ingeschakeld voor Unity Catalog, gebruikt u deze versie van het notebook:
scikit-learn-classificatienotitieblok (Unity Catalog)
Als uw werkruimte niet is ingeschakeld voor Unity Catalog, gebruikt u deze versie van het notebook:
scikit-learn-classificatienotitieblok
End-to-end-voorbeeld met scikit-learn in Azure Databricks
In dit notebook wordt scikit-learn gebruikt om een volledig end-to-end voorbeeld te illustreren van het laden van gegevens, modeltraining, afstemming van gedistribueerde hyperparameters en modeldeductie. Het illustreert ook modellevenscyclusbeheer met behulp van MLflow Model Registry om uw model te registreren en te registreren.
Als uw werkruimte is ingeschakeld voor Unity Catalog, gebruikt u deze versie van het notebook:
Scikit-learn gebruiken met MLflow-integratie in Databricks (Unity Catalog)
Als uw werkruimte niet is ingeschakeld voor Unity Catalog, gebruikt u deze versie van het notebook: