開始使用 Azure Databricks

已完成

Azure Databricks 是雲端式資料分析平台,可為資料工程、機器學習和分析提供統一的環境。 Azure Databricks 是與 Databricks 共同設計的,其領導階層建立了 Apache Spark。 Azure DataBricks 提供快速、簡單、協作的以 Apache Spark 為基礎的分析服務。 此平台會與 Azure 的其他服務深入整合,為具有增強安全性、效能和可擴縮性的使用者提供順暢的體驗。 它可讓資料驅動的工作,例如資料準備、機器學習和資料科學工作流程,使其成為一個多功能的工具,可供想要利用巨量資料的強大功能的組織使用。

Azure Databricks 的主要功能包括其原生整合 Microsoft Entra ID,以及其使用其他 Azure 服務的功能,例如 Azure 儲存體、Azure Data Lake Storage 和 Azure Cosmos DB。 此平台也提供互動式工作區,可促進資料科學家、資料工程師和商務分析師之間的共同作業。 此共同作業環境支援各種程序設計語言,例如 Python、Scala、R 和 SQL,可讓小組有效率地開發及反覆運算其資料模型。 此外,Azure Databricks 的設計目的是要輕鬆地縮放規模,同時管理機器學習演算法的計算需求,以及大型資料集的處理需求。

建立 Azure Databricks 工作區

若要使用 Azure Databricks,您必須在 Azure 訂閱中建立 Azure Databricks「工作區」。 您可以透過下列方法來完成這項作業:

  • 使用 Azure 入口網站使用者介面
  • 使用 Azure Resource Manager (ARM) 或 Bicep 範本
  • 使用 New-AzDatabricksWorkspace Azure PowerShell Cmdlet
  • 使用 AZ Databricks 工作區建立 Azure 命令行介面 (CLI) 命令

當您建立工作區時,必須指定下列其中一個定價層。

  • 標準 - 核心 Apache Spark 功能與 Microsoft Entra ID 整合。
  • 進階 - 角色型存取控制及其他企業級功能。
  • 試用 - 進階層工作區的 14 天免費試用

Azure Databricks

使用 Azure Databricks 入口網站

佈建 Azure Databricks 工作區之後,您就可以使用 Azure Databricks 入口網站來處理資料和計算資源。 Azure Databricks 入口網站是網頁型使用者介面,您可以透過此介面來建立和管理工作區資源 (例如 Spark 叢集),以及使用筆記本和查詢來處理檔案和資料表中的資料。

Azure Databricks 入口網站