标识 Azure Databricks 工作负载
Azure Databricks 为各种工作负载提供功能,其中包括机器学习和大型语言模型 (LLM)、数据科学、数据工程、BI 和数据仓库以及流式处理。
数据科学与工程
此工作负载专为需要协作完成复杂数据处理任务的数据科学家和工程师而设计。 它为数据湖屋中的大数据处理提供了与 Apache Spark 集成的环境,支持 Python、R、Scala、SQL 等多种语言。 该平台促进数据浏览、可视化和数据管道的开发。
机器学习
Azure Databricks 上的机器学习工作负载针对大规模生成、训练和部署机器学习模型的操作进行了优化。 它包括 MLflow,这是一个用于管理 ML 生命周期(包括试验、可重现性和部署)的开源平台。 它还支持各种 ML 框架,例如 TensorFlow、PyTorch 和 Scikit-learn,使其能够灵活地适用于不同的 ML 任务。
SQL
SQL 工作负载面向主要通过 SQL 与数据交互的数据分析师。 它提供熟悉的 SQL 编辑器、仪表板和自动可视化工具,可直接在 Azure Databricks 中分析和可视化数据。 此工作负载非常适合运行快速即席查询和从大型数据集创建报表。