Implementace řešení strojového učení pomocí Azure Databricks

Středně pokročilý
Data Scientist
Azure Databricks

Azure Databricks je cloudová platforma pro analýzu dat a strojové učení. Datoví vědci a technici strojového učení můžou pomocí Azure Databricks implementovat řešení strojového učení ve velkém měřítku.

Požadavky

Tento studijní program předpokládá, že máte zkušenosti s používáním Pythonu k prozkoumání dat a trénování modelů strojového učení pomocí běžných opensourcových architektur, jako jsou Scikit-Learn, PyTorch a TensorFlow. Než začnete, zvažte dokončení studijního programu Vytvořit modely strojového učení.

Moduly v tomto studijním programu

Azure Databricks je cloudová služba, která poskytuje škálovatelnou platformu pro analýzu dat pomocí Apache Sparku.

Azure Databricks je založený na Apache Sparku a umožňuje datovým inženýrům a analytikům spouštět úlohy Sparku pro transformaci, analýzu a vizualizaci dat ve velkém měřítku.

Strojové učení zahrnuje použití dat k trénování prediktivního modelu. Azure Databricks podporuje více běžně používaných architektur strojového učení, které můžete použít k trénování modelů.

MLflow je opensourcová platforma pro správu životního cyklu strojového učení, která se nativně podporuje v Azure Databricks.

Ladění hyperparametrů je základní součástí strojového učení. V Azure Databricks můžete pomocí knihovny Hyperopt optimalizovat hyperparametry automaticky.

AutoML v Azure Databricks zjednodušuje proces vytváření efektivního modelu strojového učení pro vaše data.

Hluboké učení využívá neurální sítě k trénování vysoce efektivních modelů strojového učení pro komplexní prognózování, počítačové zpracování obrazu, zpracování přirozeného jazyka a další úlohy umělé inteligence.

Strojové učení umožňuje rozhodování a automatizaci řízenou daty, ale nasazení modelů do produkčního prostředí pro přehledy v reálném čase je náročné. Azure Databricks tento proces zjednodušuje tím, že poskytuje jednotnou platformu pro vytváření, trénování a nasazování modelů strojového učení ve velkém měřítku a podporuje spolupráci mezi datovými vědci a inženýry.