镜像 Azure SQL 数据库

Fabric 中的镜像功能提供了一种简单的体验,可避免复杂的 ETL(提取转换加载),并可将现有的 Azure SQL 数据库资产与 Microsoft Fabric 中的其他数据集成在一起。 可以直接将现有 Azure SQL 数据库持续复制到 Fabric 的 OneLake 中。 在 Fabric 中,可以解锁强大的商业智能、人工智能、数据工程、数据科学和数据共享应用场景。

有关在 Fabric 中配置用于镜像的 Azure SQL 数据库的教程,请参阅教程:配置来自 Azure SQL 数据库的 Microsoft Fabric 镜像数据库

要详细了解和观看 Fabric 中的对 Azure SQL 数据库进行镜像的演示,请观看下面的数据公开剧集

为什么要使用 Fabric 中的镜像功能?

使用 Fabric 镜像功能时,无需将来自多个供应商的不同服务拼凑在一起。 相反,你可以享受高度集成且易于使用的端到端产品,该产品旨在简化你的分析需求,并为在 Microsoft、Azure SQL 数据库和可读取开源 Delta Lake 表格式的上千种技术解决方案之间建立开放性和协作而构建。

内置了哪些分析体验?

镜像数据库是 Fabric 数据仓库中的一个项,有别于“仓库”和“SQL 分析终结点”

Azure SQL 数据库的 Fabric 数据库镜像关系图。

镜像在 Fabric 工作区中创建三个项:

  • 镜像数据库项。 镜像负责将数据复制到 OneLake 中,并将其转换为便于分析的 Parquet 格式。 这为数据工程、数据科学等下游应用场景提供了支持。
  • SQL 分析终结点
  • 默认语义模型

每个镜像 Azure SQL 数据库都有一个自动生成的 SQL 分析终结点,可基于镜像过程创建的增量表,提供丰富的分析体验。 用户可以使用熟悉的 T-SQL 命令来定义和查询数据对象,但不能操作 SQL 分析终结点的数据,因为它是只读副本。 可在 SQL 分析终结点中执行以下操作:

  • 浏览从 Azure SQL 数据库引用 Delta Lake 表中数据的表。
  • 创建无代码查询和视图,无需编写任何代码行即可直观地浏览数据。
  • 开发 SQL 视图、内联 TVF(表值函数)和存储过程,以 T-SQL 封装语义和业务逻辑。
  • 管理对象的权限。
  • 在同一工作区中查询其他仓库和湖屋中的数据。

除了 Microsoft Fabric SQL 查询编辑器外,还有一个广泛的工具生态系统可以查询 SQL 分析终结点,包括 SQL Server Management Studio使用 Visual Studio Code 的 mssql 扩展,甚至 GitHub Copilot。

网络要求

目前,镜像不支持 Azure 虚拟网络或专用网络后的 Azure SQL 数据库逻辑服务器。 如果 Azure 数据库实例在专用网络后,则无法启用 Azure SQL 数据库镜像。

活动事务、工作负载以及复制程序引擎行为

  • 活动事务将继续保留事务日志截断,直到事务提交并且镜像 Azure SQL 数据库跟上进度,或事务中止。 长时间运行的事务可能会导致填充超过通常情况的事务日志量。 应监视源数据库事务日志,以避免填充大量事务日志。 有关详细信息,请参阅长时间运行的事务和 CDC 导致事务日志增长
  • 用户工作负载各不相同。 在初始快照期间,源数据库的 CPU 和 IOPS(读取页面的每秒输入/输出操作)资源使用量可能会增加。 表更新/删除操作可能会导致生成的日志增加。 详细了解如何监视 Azure SQL 数据库的资源
  • 复制引擎会单独监视每个表的更改。 如果源表中没有更新,复制引擎将开始以指数级速度延长处理表的间隔时间,最长可达一小时。 如果出现暂时性错误,数据刷新受阻,也会出现同样的情况。 检测到更新数据后,复制引擎将自动恢复常规的轮询。

层级和购买模型支持

源 Azure SQL 数据库可以是单一数据库,也可以是弹性池中的数据库。

下一步