Condividi tramite


Usare scikit-learn in Azure Databricks

Questa pagina fornisce esempi di come usare il pacchetto scikit-learn per eseguire il training dei modelli di Machine Learning in Azure Databricks. scikit-learn è una delle librerie Python più diffuse per l'apprendimento automatico a nodo singolo ed è inclusa in Databricks Runtime e Databricks Runtime ML. Vedere Note sulla versione di Databricks Runtime per informazioni sulla versione della libreria scikit-learn inclusa nel runtime del cluster.

È possibile importare il notebook nell'account di Azure Databricks ed eseguirlo.

Per altri notebook di esempio per iniziare rapidamente su Azure Databricks, vedere il Tutorial: Introduzione all'intelligenza artificiale e all'apprendimento automatico.

Esempio di base con scikit-learn

Questo notebook offre una rapida panoramica del training del modello di Machine Learning in Azure Databricks. Usa il pacchetto per scikit-learn eseguire il training di un modello di classificazione semplice. Illustra anche l'uso di MLflow per tenere traccia del processo di sviluppo del modello e Optuna per automatizzare l'ottimizzazione degli iperparametri.

Se l'area di lavoro è abilitata per Unity Catalog, usare questa versione del notebook:

Notebook di classificazione scikit-learn (catalogo Unity)

Prendi notebook

Se l'area di lavoro non è abilitata per Unity Catalog, usare questa versione del notebook:

Notebook di classificazione scikit-learn

Prendere notebook

Esempio end-to-end con scikit-learn in Azure Databricks

Questo notebook usa scikit-learn per illustrare un esempio completo di caricamento di dati, training del modello, ottimizzazione degli iperparametri distribuiti e inferenza del modello. Illustra anche la gestione del ciclo di vita del modello usando MLflow Model Registry per registrare il modello.

Se l'area di lavoro è abilitata per Unity Catalog, usare questa versione del notebook:

Usare scikit-learn con l'integrazione di MLflow in Databricks (Catalogo Unity)

Prendi il notebook

Se l'area di lavoro non è abilitata per Unity Catalog, usare questa versione del notebook:

Usare scikit-learn con l'integrazione di MLflow in Databricks

Prendere il notebook