Usare scikit-learn in Azure Databricks
Questa pagina fornisce esempi di come usare il pacchetto scikit-learn
per eseguire il training dei modelli di Machine Learning in Azure Databricks. scikit-learn è una delle librerie Python più diffuse per l'apprendimento automatico a nodo singolo ed è inclusa in Databricks Runtime e Databricks Runtime ML. Vedere Note sulla versione di Databricks Runtime per informazioni sulla versione della libreria scikit-learn inclusa nel runtime del cluster.
È possibile importare il notebook nell'account di Azure Databricks ed eseguirlo.
Per ulteriori esempi di notebook per iniziare rapidamente a lavorare su Azure Databricks, vedere Esercitazioni: Iniziare con l'intelligenza artificiale e l'apprendimento automatico.
Esempio di base con scikit-learn
Questo notebook offre una rapida panoramica del training del modello di Machine Learning in Azure Databricks. Usa il pacchetto per scikit-learn
eseguire il training di un modello di classificazione semplice. Illustra anche l'uso di MLflow per tenere traccia del processo di sviluppo del modello e Optuna per automatizzare l'ottimizzazione degli iperparametri.
Se l'area di lavoro è abilitata per il catalogo Unity, usare questa versione del notebook:
Notebook di classificazione scikit-learn (Unity Catolog)
Se l'area di lavoro non è abilitata per il catalogo Unity, usare questa versione del notebook:
Notebook di classificazione scikit-learn
Esempio end-to-end con scikit-learn in Azure Databricks
Questo notebook usa scikit-learn per illustrare un esempio completo di caricamento di dati, training del modello, ottimizzazione degli iperparametri distribuiti e inferenza del modello. Illustra anche la gestione del ciclo di vita del modello usando MLflow Model Registry per registrare il modello.
Se l'area di lavoro è abilitata per il catalogo Unity, usare questa versione del notebook:
Usare scikit-learn con l'integrazione di MLflow in Databricks (Unity Catalog)
Se l'area di lavoro è non abilitata per Unity Catalog, non usare questa versione del notebook.