Condividi tramite


Usare Apache Spark MLlib in Azure Databricks

Questa pagina fornisce notebook di esempio che illustrano come usare MLlib in Azure Databricks.

Apache Spark MLlib è la libreria di Machine Learning di Apache Spark costituita da utilità e algoritmi di apprendimento comuni, tra cui classificazione, regressione, clustering, filtro collaborativo, riduzione della dimensionalità e primitive di ottimizzazione sottostanti. Per informazioni di riferimento sulle funzionalità di MLlib, Azure Databricks consiglia di consultare la documentazione di riferimento seguente sulle API per Apache Spark:

Per informazioni sull'uso di Apache Spark MLlib da R, consultare la documentazione di Apprendimento automatico per R.

Notebook di esempio della classificazione binaria

Questo notebook illustra come creare un'applicazione di classificazione binaria usando l'API Pipelines di Apache Spark MLlib.

Notebook di classificazione binaria

Prendi il notebook

Notebook di esempio di alberi delle decisioni

Questi esempi illustrano varie applicazioni degli alberi delle decisioni usando l'API Pipelines di Apache Spark MLlib.

Alberi delle decisioni

Questi notebook illustrano come eseguire le classificazioni con gli alberi delle decisioni.

Alberi delle decisioni per il notebook di riconoscimento delle cifre

Prendi il notebook

Alberi delle decisioni per il notebook del sondaggio OFS

Prendi il notebook

Regressione GBT con pipeline MLlib

Questo notebook illustra come usare le pipeline MLlib per eseguire una regressione usando alberi con boosting a gradienti per prevedere il numero di noleggi di biciclette (all'ora) da informazioni quali il giorno della settimana, il meteo, la stagione e così via.

Notebook di regressione per il bike sharing

Prendi il notebook

Esempio di notebook avanzato di Apache Spark MLlib

Questo notebook illustra come creare un trasformatore personalizzato.

Notebook del trasformatore personalizzato

Prendi il notebook