Identifikace úloh Azure Databricks
Azure Databricks nabízí možnosti pro různé úlohy, včetně strojového učení a velkých jazykových modelů (LLM), Datová Věda, Datoví technici, BI a Skladování Dat a zpracování streamování.
Příprava dat
Azure Databricks poskytuje možnosti pro datové vědce a techniky, kteří potřebují spolupracovat na složitých úlohách zpracování dat. Poskytuje integrované prostředí s Apache Sparkem pro zpracování velkých objemů dat v datovém jezeře a podporuje více jazyků, včetně Pythonu, R, Scaly a SQL. Platforma usnadňuje zkoumání, vizualizaci dat a vývoj datových kanálů.
Machine Learning
Azure Databricks podporuje vytváření, trénování a nasazování modelů strojového učení ve velkém měřítku. Zahrnuje MLflow, opensourcovou platformu pro správu životního cyklu ML, včetně experimentování, reprodukovatelnosti a nasazení. Podporuje také různé architektury ML, jako jsou TensorFlow, PyTorch a Scikit-learn, díky čemuž je univerzální pro různé úlohy ML.
SQL
Datoví analytici, kteří primárně pracují s daty prostřednictvím SQL, můžou používat SQL Warehouse v Azure Databricks. Portál Azure Databricks poskytuje známý editor SQL, řídicí panely a nástroje pro automatickou vizualizaci pro analýzu a vizualizaci dat přímo v Azure Databricks. Tato úloha je ideální pro spouštění rychlých ad hoc dotazů a vytváření sestav z velkých datových sad.