启用 Cosmos DB 帐户以使用 Azure Synapse Link
Azure Synapse Link for Azure Cosmos DB 是一种云原生 HTAP 功能,使用该功能可实现 Azure Cosmos DB 和 Azure Synapse Analytics 之间的集成。
在上图中,演示了 Azure Synapse Link for Cosmos DB 体系结构的以下主要功能:
- Azure Cosmos DB 容器提供基于行的事务存储,该存储针对读/写操作进行了优化。
- 该容器还提供一个基于列的分析存储,该存储针对分析工作负载进行了优化。 完全托管的自动同步过程使数据存储保持同步。
- Azure Synapse Link 提供了一个链接服务,该服务将 Azure Cosmos DB 中已启用分析存储的容器连接到 Azure Synapse Analytics 工作区。
- Azure Synapse Analytics 提供 Synapse SQL 和 Apache Spark 运行时,你可以在其中运行代码来检索、处理和分析来自 Azure Cosmos DB 分析存储的数据,而不会影响 Azure Cosmos DB 中的事务数据存储。
在 Azure Cosmos DB 中启用 Azure Synapse Link
使用 Azure Synapse Link for Cosmos DB 的第一步是在 Azure Cosmos DB 帐户中启用它。 以下类型的 Azure Cosmos DB 帐户支持 Azure Synapse Link:
- Azure Cosmos DB for NoSQL
- Azure Cosmos DB for MongoDB
- Azure Cosmos DB for Apache Gremlin(预览版)
可以在 Cosmos DB 帐户的 Azure 门户页面中启用 Azure Synapse Link,也可以从命令行或脚本使用 Azure CLI 或 Azure PowerShell 来启用它。
使用 Azure 门户
在 Azure 门户中,可以在“集成”部分的“Azure Synapse Link”页上为 Cosmos DB 帐户启用 Azure Synapse 链接,如下所示。
提示
对于 Azure Cosmos DB for NoSQL 帐户,“数据资源管理器”页上也有链接。
使用 Azure CLI
若要使用 Azure CLI 启用 Azure Synapse Link,请使用 --enable-analytical-storage true
参数运行 az cosmosdb create
命令(用于创建新的 Cosmos DB 帐户)或 az cosmosdb update
命令(用于配置现有的 Cosmos DB 帐户)。 例如,以下命令会更新名为 my-cosmos-db 的现有 Cosmos DB 帐户,以启用 Azure Synapse Link。
az cosmosdb update --name my-cosmos-db --resource-group my-rg --enable-analytical-storage true
若要为 Azure Cosmos DB for Apache Gremlin 帐户启用 Azure Synapse Link,请加入 --capabilities EnableGremlin
参数。
使用 Azure PowerShell
若要使用 Azure PowerShell 启用 Azure Synapse Link,请使用 -EnableAnalyticalStorage 1
参数运行 New-AzCosmosDBAccount
cmdlet(用于创建新的 Cosmos DB 帐户)或 Update-AzCosmosDBAccount
cmdlet(用于配置现有的 Cosmos DB 帐户)。 例如,以下命令会更新名为 my-cosmos-db 的现有 Cosmos DB 帐户,以启用 Azure Synapse Link。
Update-AzCosmosDBAccount -Name "my-cosmos-db" -ResourceGroupName "my-rg" -EnableAnalyticalStorage 1
启用 Azure Synapse Link 的注意事项
在计划启用 Azure Synapse Link for a Cosmos DB 帐户时,请考虑以下事实:
为帐户启用 Azure Synapse Link 后,无法将其禁用。
启用 Aure Synapse Link 不会开始将操作数据同步到分析存储 - 还必须创建或更新支持分析存储的容器。
使用 Azure CLI 或 PowerShell 为 Cosmos DB for NoSQL 帐户启用 Azure Synapse Link 时,可以使用
--analytical-storage-schema-type
(Azure CLI) 或-AnalyticalStorageSchemaType
(PowerShell) 参数,以将架构类型指定为WellDefined
(默认)或FullFidelity
。 对于 Cosmos DB for MongoDB 帐户,默认(且仅支持)的架构类型为FullFidelity
。分配架构类型后,无法对其进行更改。
注意
你将在下一单元中了解有关分析存储及其架构类型的详细信息。