Identifiera Azure Databricks-arbetsbelastningar

Slutförd

Azure Databricks erbjuder funktioner för olika arbetsbelastningar som Machine Learning och LARGE Language Models (LLM), Datavetenskap, Dataingenjör ing, BI och Datalagring och strömningsbearbetning.

Datavetenskap och teknik

Den här arbetsbelastningen är utformad för dataforskare och tekniker som behöver samarbeta om komplexa databearbetningsuppgifter. Den tillhandahåller en integrerad miljö med Apache Spark för stordatabearbetning i ett datasjöhus och har stöd för flera språk, inklusive Python, R, Scala och SQL. Plattformen underlättar datautforskning, visualisering och utveckling av datapipelines.

Diagram över skärmen Databricks-datainmatning och datakällor.

Machine Learning

Machine Learning-arbetsbelastningen i Azure Databricks är optimerad för att skapa, träna och distribuera maskininlärningsmodeller i stor skala. Den innehåller MLflow, en plattform med öppen källkod för att hantera ML-livscykeln, inklusive experimentering, reproducerbarhet och distribution. Det stöder också olika ML-ramverk som TensorFlow, PyTorch och Scikit-learn, vilket gör det mångsidigt för olika ML-uppgifter.

Diagram över Databricks Machine Learning-skärmen.

SQL

SQL-arbetsbelastningen riktar sig till dataanalytiker som främst interagerar med data via SQL. Den innehåller en välbekant SQL-redigerare, instrumentpaneler och automatiska visualiseringsverktyg för att analysera och visualisera data direkt i Azure Databricks. Den här arbetsbelastningen är perfekt för att köra snabba ad hoc-frågor och skapa rapporter från stora datauppsättningar.

Diagram över skärmen DatabricksSQL-redigerare.