Usare Apache Spark MLlib in Azure Databricks
Questa pagina fornisce notebook di esempio che illustrano come usare MLlib in Azure Databricks.
Apache Spark MLlib è la libreria di Machine Learning di Apache Spark costituita da utilità e algoritmi di apprendimento comuni, tra cui classificazione, regressione, clustering, filtro collaborativo, riduzione della dimensionalità e primitive di ottimizzazione sottostanti. Per informazioni di riferimento sulle funzionalità di MLlib, Azure Databricks consiglia di consultare la documentazione di riferimento seguente sulle API per Apache Spark:
- Guida alla programmazione di MLlib
- Informazioni di riferimento per l'API Python
- Informazioni di riferimento per l'API Scala
- API Java
Per informazioni sull'uso di Apache Spark MLlib da R, consultare la documentazione di Apprendimento automatico per R.
Notebook di esempio della classificazione binaria
Questo notebook illustra come creare un'applicazione di classificazione binaria usando l'API Pipelines di Apache Spark MLlib.
Notebook di classificazione binaria
Notebook di esempio di alberi delle decisioni
Questi esempi illustrano varie applicazioni degli alberi delle decisioni usando l'API Pipelines di Apache Spark MLlib.
Alberi delle decisioni
Questi notebook illustrano come eseguire le classificazioni con gli alberi delle decisioni.
Alberi delle decisioni per il notebook di riconoscimento delle cifre
Alberi delle decisioni per il notebook del sondaggio OFS
Regressione GBT con pipeline MLlib
Questo notebook illustra come usare le pipeline MLlib per eseguire una regressione usando alberi con boosting a gradienti per prevedere il numero di noleggi di biciclette (all'ora) da informazioni quali il giorno della settimana, il meteo, la stagione e così via.
Notebook di regressione per il bike sharing
Esempio di notebook avanzato di Apache Spark MLlib
Questo notebook illustra come creare un trasformatore personalizzato.