Azure Synapse Analytics 如何運作

已完成

為支援現今組織的分析需求,Azure Synapse Analytics 結合了可儲存和處理資料的集中式服務與可延伸的架構,讓「連結服務」透過此組合整合常用的資料存放區、處理平台和視覺效果工具。

建立與使用 Azure Synapse Analytics 工作區

Synapse Analytics「工作區」會定義 Synapse Analytics 服務的執行個體,您可以在其中管理分析解決方案所需的服務和資料資源。 您可以使用 Azure 入口網站,以互動方式在 Azure 訂閱中建立 Synapse Analytics 工作區,或使用 Azure PowerShell、Azure 命令列介面 (CLI),或使用 Azure Resource Manager 或 Bicep 範本自動化部署。

建立 Synapse Analytics 工作區之後,您可以管理工作區中的服務,並使用 Synapse Studio (Azure Synapse Analytics 的 Web 型入口網站) 執行資料分析工作。

Azure Synapse Studio 的螢幕擷取畫面。

使用資料湖中的檔案

Synapse Analytics 工作區中的核心資源之一是「資料湖」,您可在此大規模儲存與處理資料檔案。 工作區通常會有預設的資料湖,實作為 Azure Data Lake Storage Gen2 容器的連結服務。 您可以視需要,根據不同的儲存平台為多個資料湖新增連結服務。

Azure Studio 中的資料湖連結服務螢幕擷取畫面。

使用管線內嵌與轉換資料

在大部分的企業資料分析解決方案中,資料是擷取自多個作業來源,並傳輸至中央資料湖或資料倉儲進行分析。 Azure Synapse Analytics 包含建立、執行與管理「管線」的內建支援,可協調從各種來源擷取資料所需的活動、視需要轉換資料,以及將產生的轉換資料載入分析存放區。

Azure Synapse Studio 中的管線螢幕擷取畫面。

注意

Azure Synapse Analytics 中的管線基礎,使用與 Azure Data Factory 相同的基礎技術。 如已熟悉 Azure Data Factory,您可以利用現有的技能,在 Azure Synapse Analytics 中建置資料內嵌和轉換解決方案。

使用 SQL 查詢及處理資料

結構化查詢語言 (SQL) 是查詢及處理資料的通用語言,也是關聯式資料庫的基礎,包括熱門的 Microsoft SQL Server 資料庫平台。 Azure Synapse Analytics 支援透過以 SQL Server 關聯式資料庫引擎為基礎的兩種 SQL「集區」來查詢及處理 SQL 型資料:

  • 內建的「無伺服器」集區已經過最佳化,可使用關聯式 SQL 語意來查詢資料湖中的檔案型資料。
  • 可裝載關聯式資料倉儲的自訂「專用」SQL 集區。

Azure Synapse SQL 系統使用分散式查詢處理模型來平行處理 SQL 作業,進而產生可大幅縮放的關聯式資料處理解決方案。 您可以使用內建無伺服器集區,對資料湖中的檔案資料進行符合成本效益的分析和處理,並使用專用的 SQL 集區來建立企業資料模型和報告的關聯式資料倉儲。

Azure Synapse Studio 中的 SQL 查詢和資料庫螢幕擷取畫面。

使用 Apache Spark 處理與分析資料

Apache Spark 是適用於巨量資料分析的開放原始碼平台。 Spark 可執行能使用任一種受支援程式設計語言實作的工作,對資料湖中的檔案執行分散式處理。 Spark 支援的語言包括 Python、Scala、Java、SQL 和 C#。

在 Azure Synapse Analytics 中,您可以建立一或多個 Spark 集區,並使用互動式「筆記本」,在您建置資料分析、機器學習和資料視覺效果的解決方案時,結合程式碼和筆記。

Azure Synapse Studio 中的 Spark 筆記本螢幕擷取畫面。

使用資料總管探索資料

Azure Synapse 資料總管是以 Azure Data Explorer 服務為基礎的 Azure Synapse Analytics 資料處理引擎。 資料總管使用名為 Kusto 查詢語言 (KQL) 的直覺式查詢語法,實現批次和串流資料的高效能、低延遲分析。

Azure Synapse Studio 中的 Kusto 查詢語言指令碼螢幕擷取畫面。

與其他 Azure 資料服務相整合

Azure Synapse Analytics 可與其他 Azure 資料服務整合,以取得端對端分析解決方案。 整合式解決方案包括:

  • Azure Synapse Link 可近乎即時同步 Azure Cosmos DB、Azure SQL Database、SQL Server 和 Microsoft Power Platform Dataverse 的作業資料,與可使用 Azure Synapse Analytics 查詢的分析資料儲存體。
  • Microsoft Power BI 整合可讓資料分析師將 Power BI 工作區整合到 Synapse 工作區,並在 Azure Synapse Studio 中執行互動式資料視覺效果。
  • Microsoft Purview 整合可讓組織在 Azure Synapse Analytics 中編製資料資產目錄,讓資料工程師在實作將資料內嵌至 Azure Synapse Analytics 的資料管線時,更輕鬆尋找資料資產及追蹤資料歷程。
  • Azure Machine Learning 整合可讓資料分析師和資料科學家將預測模型定型和取用整合到分析解決方案中。