本文解答了有关 Microsoft Fabric 中镜像 Azure Cosmos DB 数据库的常见问题。
重要
Azure Cosmos DB 镜像目前处于预览阶段。 预览期间不支持生产工作负载。 目前,仅支持 Azure Cosmos DB for NoSQL 帐户。
一般问题
就 Azure Cosmos DB 而言,镜像与快捷方式有何不同?
镜像以开源 delta 格式将源数据库复制到 Fabric OneLake 中。 可以从 Fabric 中的任何位置对这些数据进行分析。 快捷方式不会将数据复制到 Fabric OneLake 中。 而是将快捷方式链接到源数据,且无需数据移动。 目前,Azure Cosmos DB 仅可用作镜像源。
镜像是否会影响源 Azure Cosmos DB 数据库的性能?
不,镜像不会影响源数据库的性能或成本。 镜像需要在源 Azure Cosmos DB 帐户上启用连续备份功能。 连续备份可在不影响事务性工作负载的情况下实现复制。
镜像 Azure Cosmos DB 是否能在功能上替代 Fabric 中的管道复制作业?
镜像是在 Azure Cosmos DB 中对数据的低延迟复制。 与复制作业不同,镜像会创建 Azure Cosmos DB 数据的连续增量副本。 镜像不会影响源数据库或容器上的事务性工作负载。
相比之下,复制作业是计划作业,可能会增加增量作业的端到端延迟。 此外,复制作业需求管理可以获取增量更改,增加 Fabric 中的计算开销,并影响 Azure Cosmos DB 中源数据库上的请求单位消耗。
复制作业适用于 Azure Cosmos DB 中的一次性复制作业,但镜像非常适合跟踪增量更改。
试用镜像功能是否会影响我的 Azure Cosmos DB 帐户?
不,你可以在源 Azure Cosmos DB 帐户或数据没有任何影响的情况下,启用或禁用镜像。
警告
如果在 Azure Cosmos DB 帐户上启用连续备份,以便镜像到 Fabric,则无法禁用连续备份。 同样,如果启用了连续备份,就不能禁用 Azure Cosmos DB 帐户的分析存储。
定价
镜像 Azure Cosmos DB 会产生哪些费用?
镜像功能目前为预览版。 目前,用于将数据从 Azure Cosmos DB 复制到 Fabric OneLake 的计算是免费的。 OneLake 的存储费用在一定限度内也是免费的。 有关详细信息,请参阅镜像的 OneLake 定价。 使用 SQL、Power BI 或 Spark 查询数据的计算按常规费率收费。
对于 Azure Cosmos DB,连续备份是镜像的先决条件。 如果在镜像之前启用了任何连续备份层,则不会产生任何额外费用。 如果专门为镜像启用连续备份,则 7 天备份模式是免费的;如果启用 30 天备份,系统会按该功能的价格向你收费。 有关详细信息,请参阅 Azure Cosmos DB 定价。
如果使用数据资源管理器查看 Azure Cosmos DB 中的源数据,则会根据请求单位 (RU) 使用情况产生费用。
如何处理镜像 Azure Cosmos DB 的出口费用?
仅当 Azure Cosmos DB 帐户与 Fabric 容量位于不同的区域时,才会收取出口费用。 在 Azure Cosmos DB 帐户有多个读取区域的情况下,Fabric 会从地理位置上最靠近 Fabric 容量区域的 Azure 区域镜像。 有关详细信息,请参阅复制限制。
Azure Synapse Link 和分析存储
镜像是否使用 Azure Cosmos DB 分析存储?
不,镜像不使用分析存储。 镜像不会影响事务性工作负载或吞吐量消耗。
在 Azure Cosmos DB 中,连续备份是镜像的先决条件。 有了这个前提条件,Fabric 就可以镜像数据,而不会影响事务性工作负载或需要分析存储。
镜像是否使用适用于 Azure Cosmos DB 的 Azure Synapse Link?
不,Fabric 中的镜像与 Azure Synapse Link 无关。
在 Azure Cosmos DB 中,连续备份是镜像的先决条件。 有了这个前提条件,Fabric 就可以镜像数据,而不会影响事务性工作负载或需要分析存储。
镜像是否会影响 Azure Synapse Link 与 Azure Cosmos DB 的协同工作?
不,Fabric 中的镜像与 Azure Synapse Link 无关。 在使用 Fabric 镜像时,可以继续使用 Azure Synapse Link。
在使用镜像时,是否可以继续使用 Azure Cosmos DB 的分析存储作为 Azure Data Factory 中的变更数据捕获 (CDC) 源?
是,可以在同一 Azure Cosmos DB 帐户上使用分析存储和 Fabric 镜像。 这些功能彼此独立工作。 镜像不会干扰分析存储的使用。
在使用镜像时,是否可以继续使用 Azure Cosmos DB 的更改源?
是,可以在同一 Azure Cosmos DB 帐户上使用更改源和 Fabric 镜像。 这些功能彼此独立工作。 镜像不会影响更改源的使用。
使用镜像后,是否可以对 Azure Cosmos DB 帐户禁用分析存储?
镜像需要 Azure Cosmos DB 连续备份作为先决条件。 启用连续备份的 Azure Cosmos DB 帐户不能禁用分析存储。 在任何集合上禁用分析存储后,就无法启用连续备份。 这是一个临时限制。
有了镜像,是否要弃用适用于 Azure Cosmos DB 的 Azure Synapse Link?
不,Azure Synapse Link 和 Azure Synapse Analytics 仍然可用于工作负载。 目前没有计划弃用这些工作负载。 你可以继续将 Azure Synapse Link 用于生产工作负载。
数据连接和身份验证
如何管理 Azure Cosmos DB 的镜像连接?
在 Fabric 门户中,选择“设置”部分中的“管理连接和网关”选项。
Azure Cosmos DB 帐户允许使用哪些身份验证方法?
仅支持读写帐户密钥。
是否可以使用单一登录和基于角色的访问控制作为镜像 Azure Cosmos DB 的身份验证方式?
不,目前仅支持读写帐户密钥。
是否可以将托管标识作为镜像 Azure Cosmos DB 的身份验证方式?
不,目前仅支持读写帐户密钥。
如果轮换 Azure Cosmos DB 帐户密钥会发生什么?
如果轮换帐户密钥,则必须更新 Fabric 镜像的连接凭证。 如果不更新密钥,镜像就会失败。 若要解决此问题,请停止复制,使用新轮换的密钥更新凭证,然后重启复制。
安装
是否可以在 Azure Cosmos DB 数据库中选择特定容器进行镜像?
不,从 Azure Cosmos DB 镜像数据库时,所有容器都将复制到 Fabric OneLake 中。
是否可以使用镜像多次复制单个 Azure Cosmos DB 数据库?
是,可以有多个镜像,但没有必要。 复制的数据进入 Fabric 后,可以直接从 Fabric 共享到其他目标。
是否可以为使用镜像创建的 Azure Cosmos DB 数据副本创建快捷方式?
不,镜像不支持创建外部源的快捷方式,如 Azure Data Lake Storage (ADLS) Gen2 或 Amazon Web Services (AWS) Simple Storage Service (S3)。
Azure Cosmos DB 数据资源管理器
在 Fabric 中选择“视图”和“源数据库”时,我看到的是 OneLake 中的数据还是 Azure Cosmos DB 中的数据?
Fabric 中用于查看源数据库的选项使用数据资源管理器提供 Azure Cosmos DB 中实时数据的只读视图。 此透视图是作为复制数据源的容器的实时视图。
直接在 Fabric 门户中查看实时数据的视图是一种有用的工具,可用于确定 OneLake 中的数据与源 Azure Cosmos DB 数据库相比是否是最新的或是否表示正确。 对实时 Azure Cosmos DB 数据使用数据资源管理器的操作可能会增加请求单位消耗。
Azure Cosmos DB 数据分析
如何分析镜像到 OneLake 中的 Azure Cosmos DB 数据?
使用 Fabric 门户针对 SQL 分析终结点创建新的 SQL 查询。 在这里,可以运行常见的查询,例如 SELECT TOP 100 * FROM ...
。
此外,使用 Lakehouse 来分析 OneLake 数据和其他数据。 在湖屋中,可以利用 Spark 通过笔记本查询数据。
如何在 Azure Cosmos DB 的镜像中同步数据?
数据同步是完全托管的。 启用镜像后,数据将以近乎实时的方式复制到 Fabric OneLake 中,并且镜像会在源数据库中发生新更改时持续复制。
Azure Cosmos DB 镜像是否可跨 Azure 和 Fabric 区域工作?
支持跨区域镜像,但这种情况可能会导致意外的网络数据出口成本和延迟。 理想情况下,将 Fabric 容量与 Azure Cosmos DB 帐户的某个区域匹配。 有关详细信息,请参阅复制限制。
Azure Cosmos DB 的镜像数据是否仅使用 SQL 分析终结点提供?
可在 Lakehouse 中将现有的镜像数据库添加为快捷方式。 在湖屋中,可以直接浏览数据,在笔记本中打开数据以进行 Spark 查询,或构建机器学习模型。
重要
湖屋中的快捷方式是镜像数据库的快捷方式,即 Azure Cosmos DB 数据的 OneLake 副本。 湖屋中的快捷方式不能直接访问 Azure Cosmos DB 帐户或数据。
Azure Cosmos DB 数据的初始复制需要多长时间?
初始复制和连续复制的延迟因数据量而异。 在大多数情况下,延迟可能是几分钟,但对于大量数据,延迟可能会更长。
复制 Azure Cosmos DB 插入、更新和删除操作需要多长时间?
复制初始数据后,就可以近乎实时地复制单个操作。 在极少数情况下,如果源数据库在一个时间窗口内有大量的更新和删除操作,可能会出现少量延迟。
镜像是否具有 Azure Cosmos DB 的内置回退逻辑?
不,镜像没有内置的回退逻辑,因为复制是连续的和增量的。
镜像是否支持 Azure Cosmos DB 中的更改数据源?
不,镜像目前不支持 Azure Cosmos DB 镜像数据的更改数据源。
镜像是否支持从 Azure Cosmos DB 复制的数据的奖牌体系结构?
镜像没有对奖牌体系结构的内置支持。 你可以使用水印逻辑配置自己的银牌层和金牌层,以使用管道或 Spark 进行转换和联接。
Power BI 报告是否对 Azure Cosmos DB 中的镜像数据使用 Direct Lake 模式?
是的。
Azure Cosmos DB 镜像是否支持嵌套数据?
是,嵌套数据在 OneLake 中以 JSON 字符串的形式平展。 使用 OPENJSON
、CROSS APPLY
和 OUTER APPLY
平展视图数据。 有关详细信息,请参阅嵌套数据。
Azure Cosmos DB 镜像是否支持自动平展。
不,镜像不会自动平展嵌套数据。 SQL 分析终结点可以使用一些方法来处理嵌套的 JSON 字符串。 有关详细信息,请参阅嵌套数据。
我是否应该担心 Azure Cosmos DB 镜像数据的冷启动性能?
不,一般来说,Fabric 中的 SQL 查询不会遇到冷启动延迟。
如果在镜像时删除 Azure 中的源 Azure Cosmos DB 数据库,会发生什么情况?
Fabric 中的数据资源管理器和复制功能开始失效。 OneLake 数据保持原样,直到删除现有镜像数据。
镜像 Azure Cosmos DB 后,如何将 SQL 分析终结点连接到客户端工具或应用程序?
连接到镜像数据的 SQL 分析终结点类似于在 Fabric 中对任何其他项使用相同的终结点。 有关详细信息,请参阅连接到 Fabric 中的数据仓库。。
如何跨数据库联接 Azure Cosmos DB 镜像数据?
独立镜像每个 Azure Cosmos DB 数据库。 然后,将其中一个 SQL 分析终结点作为镜像数据库项添加到另一个终结点。 接下来,使用 SQL JOIN
查询跨不同 Azure Cosmos DB 数据库中的容器执行查询。
如何将 Azure Cosmos DB 镜像数据与 Azure SQL 数据库或 Snowflake 数据联接?
镜像 Azure Cosmos DB 数据库。 然后,镜像 Azure SQL 数据库或 Snowflake 的数据。 然后,将其中一个 SQL 分析终结点作为镜像数据库项添加到另一个终结点。 现在,使用 SQL JOIN
查询跨多个数据服务执行查询。
复制操作
如何停止或禁用镜像 Azure Cosmos DB 数据库的复制?
使用 Fabric 门户的“停止复制”选项停止复制。 此操作将完全停止复制,但不会删除 OneLake 中已存在的任何数据。
如何重启镜像 Azure Cosmos DB 数据库的复制?
复制不支持暂停或恢复的概念。 “停止复制”会完全停止复制,而在 Fabric 门户中选择“重启复制”则完全从头开始复制。 重启复制会将 OneLake 数据替换为最新数据,而不是增量更新数据。
为什么找不到为镜像 Azure Cosmos DB 数据库配置复制的选项?
Azure Cosmos DB 镜像会自动镜像所选数据库中的所有容器。 由于这种细微差别,Fabric 门户不包含为 Azure Cosmos DB 配置特定复制选项的选项。
对于复制的 Azure Cosmos DB 数据,每个复制状态消息意味着什么?
理想情况下,希望复制处于“正在运行”状态。 如果复制状态为“正在运行,但有警告”,则复制成功,但有一个问题需要解决。 正在停止、已停止、失败或错误状态表示更严重的状态,需要干预才能继续复制。 有关详细信息,请参阅监视 Fabric 镜像。
分析生存时间 (TTL) 或软删除
通过 Azure Cosmos DB 的生存时间 (TTL) 功能删除的项是否也会从镜像数据库中删除?
是,使用 TTL 删除的数据与使用 Azure Cosmos DB 中的删除操作删除的数据的方式相同。 然后,从镜像数据库中删除数据。 镜像无法区分这些删除模式。
是否可以为 Azure Cosmos DB 中 Fabric 镜像的分析数据配置软删除?
删除操作会立即复制到 OneLake。 目前无法配置软删除或分析生存时间 (TTL)。
Azure Cosmos DB 镜像是否支持分析生存时间?
不,不支持分析生存时间。
访问 OneLake 数据
是否可以直接访问 Azure Cosmos DB 镜像生成的 OneLake 文件?
是,可以使用文件或存储资源管理器直接访问 OneLake 文件。 还可以在 Databricks 中使用 OneLake 差异文件。 有关详细信息,请参阅使用 OneLake 文件资源管理器直接访问 Fabric 数据或将 OneLake 与 Azure Databricks 集成。
API 支持
能否以编程方式配置 Azure Cosmos DB 镜像?
不,目前不支持自动镜像配置。
内置持续集成或部署 (CI/CD) 是否可用于 Azure Cosmos DB 镜像?
不,目前不支持内置 CI/CD。
安全性
能否使用 Power BI Gateway 或在防火墙后面访问 Azure Cosmos DB 镜像数据库?
不,目前不支持此访问级别。
Azure Cosmos DB 镜像是否支持专用终结点?
不,目前不支持专用终结点。
Azure Cosmos DB 中的镜像数据是否会离开 Fabric 租户?
不,数据仍保留在 Fabric 租户中。
Azure Cosmos DB 的镜像数据是否存储在我的环境之外?
不,数据直接暂存于租户的 OneLake 中,不会暂存于环境之外。
许可
Azure Cosmos DB 镜像有哪些许可选项?
需要 Power BI Premium、Fabric 容量或试用容量许可才能使用镜像。
用户为 Azure Cosmos DB 数据创建和配置镜像需要什么许可证?
有关许可的信息,请参阅 Fabric 许可证。
用户使用 Azure Cosmos DB 中的镜像数据需要什么许可证?
有关许可的信息,请参阅 Fabric 许可证。