使用 Azure Synapse Analytics 結合雲端規模分析功能
Azure Synapse Analytics 是布建的整合式分析服務,可加速跨數據倉儲和巨量數據系統深入解析的時間。 Azure Synapse Analytics 將以下功能整合在一起:
- 企業數據倉儲中使用的最佳 SQL 技術。
- 用於巨量數據的 Spark 技術。
- 數據應用程式的管線(來源對齊)和擷取、轉換和載入 (ETL) 或擷取、載入和轉換 (ELT)。
Azure Synapse Studio 是 Azure Synapse 中的工具,可提供統一的管理、監視、編碼和安全性體驗。 Synapse Studio 與其他 Azure 服務深入整合,例如 Power BI、Azure Cosmos DB 和 Azure Machine Learning。
注意
本節旨在說明雲端規模分析特有的指定組態。 這是對官方 Azure Synapse Analytics 文件的稱讚。
概述
在初始設定 數據登陸區域期間,您可以部署單一 Azure Synapse Analytics 工作區,供所有分析師和數據科學家使用。 您可以為特定資料整合或資料產品建立更多工作區。
如果您的數據產品需要以行級和列級安全性方式提供對 標準化數據 的存取權,那麼您可能需要額外的 Azure Synapse Analytics 工作區。 您可以使用 Azure Synapse 集區來提供這些工作區。 數據產品小組可能需要自己的工作區來建立數據產品,而個別的工作區僅適用於具有範圍開發存取權的產品小組。
Azure Synapse Analytics 設定
部署 Azure Synapse Analytics 的第一個步驟是設定 Azure Synapse 工作區,連線到 Microsoft Purview 帳戶。
Azure Synapse Analytics 網路功能
數據登陸區域會使用 Azure Synapse Analytics 受控虛擬網路來建立工作區。 與 Azure Synapse 的通訊會透過公開的三個端點進行:SQL 集區、SQL 隨選,以及開發端點。
在網路層級,雲端規模分析會使用 Synapse 管理的私人端點。 這些端點可確保數據登陸區域虛擬網路與 Azure Synapse 工作區之間的所有流量完全透過Microsoft骨幹網路移動。
Azure Synapse 數據訪問控制
在 Azure Synapse Analytics 中使用存取控制清單搭配
針對需要限制傳回之數據行和數據列的數據,建議您使用數據列層級和數據行層級安全性來限制 Azure Synapse SQL 專用或無伺服器集區中數據表的數據存取。 數據列層級安全性和數據行層級安全性會在資料庫層級以及資料庫角色之外實作。
例如,資料列級別安全性可確保在特定的數據應用或與數據來源對齊的數據產品中,使用者只能看到自己的數據。 即使數據表包含整個企業的數據也一樣。
您可以將數據列層級安全性與數據行層級安全性結合,以限制對具有敏感數據的數據行存取。 如此一來,數據列層級安全性和數據行層級安全性都會在資料庫層而非應用層套用存取限制邏輯。 每次嘗試從任何層級存取數據時,都會評估許可權。
注意
Azure Synapse 無伺服器架構 SQL 集區支援 用於檢視的數據行層級安全性,而不支持外部數據表。 如果是外部表,您可以在其上方建立邏輯檢視,然後套用欄位層級安全性。 如果是列層級安全性,可以使用自定義檢視作為替代方案。
如需詳細資訊,請參閱 Azure Synapse Analytics 資料存取控制。
Azure Data Lake 中的 Azure Synapse 資料存取控制
部署 Azure Synapse Analytics 工作區時,您需要從訂閱中取得 Azure Data Lake Storage 帳戶,或手動使用儲存帳戶的 URL。 指定的儲存帳戶已設為已部署 Azure Synapse 工作區的主要 ,用於儲存其資料。 Azure Synapse 會將資料儲存在容器中,其中包含名為 /synapse/{workspaceName}
的資料夾中的 Apache Spark 資料表和 Spark 應用程式記錄。 它也有一個容器來管理您選擇要安裝的任何程式庫。
提示
建議您在 開發層或 Data Lake 三個 帳戶上使用專用容器。 此容器會作為主要記憶體來儲存 Spark 元數據。
如需如何設定數據存取的建議,請參閱 Azure Synapse Analytics 數據存取控制。