Použití knihovny Apache Spark MLlib v Azure Databricks
Tato stránka obsahuje ukázkové poznámkové bloky, které ukazují, jak používat MLlib v Azure Databricks.
Apache Spark MLlib je knihovna strojového učení Apache Sparku, která se skládá z běžných algoritmů a nástrojů strojového učení, včetně klasifikace, regrese, clusteringu, filtrování založeného na spolupráci, snížení počtu dimenzí a základních primitiv optimalizace. Referenční informace o funkcích knihovny MLlib doporučuje Azure Databricks následující odkazy na rozhraní Apache Spark API:
- Průvodce programováním pro knihovnu MLlib
- Referenční informace k rozhraní Python API
- Referenční informace k rozhraní Scala API
- Rozhraní API Javy
Informace o použití knihovny Apache Spark MLlib z jazyka R najdete v dokumentaci k strojovému učení jazyka R.
Ukázkový poznámkový blok binární klasifikace
Tento poznámkový blok ukazuje, jak sestavit aplikaci binární klasifikace s využitím rozhraní API kanálů Apache Spark MLlib.
Poznámkový blok binární klasifikace
Pořiď si poznámkový blok
Ukázkové poznámkové bloky rozhodovacích stromů
Tyto příklady ukazují různá využití rozhodovacích stromů s využitím rozhraní API kanálů Apache Spark MLlib.
rozhodovací stromy
Tyto poznámkové bloky ukazují postup při provádění klasifikace s využitím rozhodovacích stromů.
Poznámkový blok rozhodovacích stromů pro rozpoznávání číslic
Pořiď si poznámkový blok
Poznámkový blok rozhodovacích stromů pro průzkum SFO
Pořiď si poznámkový blok
Regrese GBT s využitím kanálů MLlib
Tento poznámkový blok ukazuje využití kanálů MLlib k provedení regrese GBT pro predikci počtu pronájmů kol (za hodinu), a to na základě informací, jako jsou den v týdnu, počasí, sezóna atd.
Poznámkový blok regrese sdílení kol
Pořiď si poznámkový blok
Příklad rozšířeného poznámkového bloku Apache Spark MLlib
Tento poznámkový blok ukazuje, jak vytvořit vlastní transformátor.
Poznámkový blok vlastního transformátoru
Pořiď si poznámkový blok