Usare scikit-learn in Azure Databricks
Questa pagina fornisce esempi di come usare il pacchetto scikit-learn
per eseguire il training dei modelli di Machine Learning in Azure Databricks.
scikit-learn è una delle librerie Python più diffuse per l'apprendimento automatico a nodo singolo ed è inclusa in Databricks Runtime e Databricks Runtime ML. Vedere Note sulla versione di Databricks Runtime per informazioni sulla versione della libreria scikit-learn inclusa nel runtime del cluster.
È possibile importare il notebook nell'account di Azure Databricks ed eseguirlo.
Per altri notebook di esempio per iniziare rapidamente su Azure Databricks, vedere il Tutorial: Introduzione all'intelligenza artificiale e all'apprendimento automatico.
Esempio di base con scikit-learn
Questo notebook offre una rapida panoramica del training del modello di Machine Learning in Azure Databricks. Usa il pacchetto per scikit-learn
eseguire il training di un modello di classificazione semplice. Illustra anche l'uso di MLflow per tenere traccia del processo di sviluppo del modello e Optuna per automatizzare l'ottimizzazione degli iperparametri.
Se l'area di lavoro è abilitata per Unity Catalog, usare questa versione del notebook:
Notebook di classificazione scikit-learn (catalogo Unity)
Prendi notebook
Se l'area di lavoro non è abilitata per Unity Catalog, usare questa versione del notebook:
Notebook di classificazione scikit-learn
Prendere notebook
Esempio end-to-end con scikit-learn in Azure Databricks
Questo notebook usa scikit-learn per illustrare un esempio completo di caricamento di dati, training del modello, ottimizzazione degli iperparametri distribuiti e inferenza del modello. Illustra anche la gestione del ciclo di vita del modello usando MLflow Model Registry per registrare il modello.
Se l'area di lavoro è abilitata per Unity Catalog, usare questa versione del notebook:
Usare scikit-learn con l'integrazione di MLflow in Databricks (Catalogo Unity)
Prendi il notebook
Se l'area di lavoro non è abilitata per Unity Catalog, usare questa versione del notebook:
Usare scikit-learn con l'integrazione di MLflow in Databricks
Prendere il notebook