Identifiera Azure Databricks-arbetsbelastningar
Azure Databricks erbjuder funktioner för olika arbetsbelastningar som Machine Learning och LARGE Language Models (LLM), Datavetenskap, Dataingenjör ing, BI och Datalagring och strömningsbearbetning.
Datavetenskap och teknik
Den här arbetsbelastningen är utformad för dataforskare och tekniker som behöver samarbeta om komplexa databearbetningsuppgifter. Den tillhandahåller en integrerad miljö med Apache Spark för stordatabearbetning i ett datasjöhus och har stöd för flera språk, inklusive Python, R, Scala och SQL. Plattformen underlättar datautforskning, visualisering och utveckling av datapipelines.
Machine Learning
Machine Learning-arbetsbelastningen i Azure Databricks är optimerad för att skapa, träna och distribuera maskininlärningsmodeller i stor skala. Den innehåller MLflow, en plattform med öppen källkod för att hantera ML-livscykeln, inklusive experimentering, reproducerbarhet och distribution. Det stöder också olika ML-ramverk som TensorFlow, PyTorch och Scikit-learn, vilket gör det mångsidigt för olika ML-uppgifter.
SQL
SQL-arbetsbelastningen riktar sig till dataanalytiker som främst interagerar med data via SQL. Den innehåller en välbekant SQL-redigerare, instrumentpaneler och automatiska visualiseringsverktyg för att analysera och visualisera data direkt i Azure Databricks. Den här arbetsbelastningen är perfekt för att köra snabba ad hoc-frågor och skapa rapporter från stora datauppsättningar.