将数据加载到 Azure SQL
部署、验证和配置数据库或实例后,下一个逻辑步骤是引入数据。
选项
许多选项可用于将数据加载到 Azure SQL。 有些选项与本地提供的选项有所重叠。 本单元只重点介绍其中几个选项。
大容量复制程序
大容量复制程序 (bcp) 是一种常用工具,用于从本地连接到 Azure SQL,以及从 Azure 虚拟机连接到 Azure SQL。 然后可使用它将数据移动到 Azure SQL 中。
大容量插入
大容量插入操作类似于本地 SQL Server 中的操作,但不从计算机上的文件或多个文件加载数据,而是从 Azure Blob 存储加载数据。 下一个练习将通过一个示例来演示。
SSIS 包
在 Azure SQL 中,可使用包连接到本地 SQL Server Integration Services (SSIS)。 可以在 Azure SQL 数据库或 Azure SQL 托管实例中托管 SSIS 数据库。 此外,还可使用 Azure 数据工厂等工具将 Azure-SSIS Integration Runtime 用于 SSIS 包。
其他选项
其他有趣的选项包括,使用 Spark 或 Azure 数据工厂等技术将数据加载到 Azure SQL 数据库或 Azure SQL 托管实例。 虽然与加载并不直接相关,但可使用现有数据库来创建数据库,以进行复制或导入 BACPAC 文件。 在 Azure SQL 托管实例中,你可使用 T-SQL 命令从 URL 本机还原数据库。
有关加载数据的注意事项
将数据加载到本地与将数据加载到 Azure SQL 中的最大区别在于,对于后者,要加载的数据需要在 Azure 中托管。 数据不能托管在本地文件中。 可以将本地文件和文件系统存储在 Azure Blob 存储中作为备用项。 此策略还将提高在其中加载文件和设置 ETL 作业的效率。
还需记住,不支持最小日志记录,因此始终以完全恢复模式运行。 由于完整恢复模式和日志吞吐量限制,在加载数据时,可能会受日志治理的影响。 在大容量加载期间,使用批处理并适当地调整它们的大小非常重要。 在下个练习中,你将看到更多提示。 加载到聚集列存储索引中可能有助于避免事务日志限制,具体取决于你的方案。