Identifikace úloh Azure Databricks
Azure Databricks nabízí možnosti pro různé úlohy, včetně strojového učení a velkých jazykových modelů (LLM), Datová Věda, Datoví technici, BI a Skladování Dat a zpracování streamování.
Datová Věda a inženýrství
Tato úloha je určená pro datové vědce a techniky, kteří potřebují spolupracovat na složitých úlohách zpracování dat. Poskytuje integrované prostředí s Apache Sparkem pro zpracování velkých objemů dat v datovém jezeře a podporuje více jazyků, včetně Pythonu, R, Scaly a SQL. Platforma usnadňuje zkoumání, vizualizaci dat a vývoj datových kanálů.
Machine Learning
Úloha Machine Learning v Azure Databricks je optimalizovaná pro sestavování, trénování a nasazování modelů strojového učení ve velkém měřítku. Zahrnuje MLflow, opensourcovou platformu pro správu životního cyklu ML, včetně experimentování, reprodukovatelnosti a nasazení. Podporuje také různé architektury ML, jako jsou TensorFlow, PyTorch a Scikit-learn, díky čemuž je univerzální pro různé úlohy ML.
SQL
Úloha SQL je zaměřená na datové analytiky, kteří primárně pracují s daty prostřednictvím SQL. Poskytuje známý editor SQL, řídicí panely a nástroje pro automatickou vizualizaci pro analýzu a vizualizaci dat přímo v Azure Databricks. Tato úloha je ideální pro spouštění rychlých ad hoc dotazů a vytváření sestav z velkých datových sad.