教程:通过 SQL 机器学习在 R 中开发预测模型
适用于: SQL Server 2016 (13.x) 及更高版本 Azure SQL 托管实例
此系列教程由四个部分组成。你将在 SQL Server 机器学习服务中或大数据群集上使用 R 和一个机器学习模型来预测雪橇租赁次数。
此系列教程由四个部分组成。你将在 SQL Server 机器学习服务中使用 R 和一个机器学习模型来预测雪橇租赁次数。
此系列教程由四个部分组成。你将在 SQL Server R Services 中使用 R 和一个机器学习模型来预测雪橇租赁次数。
此系列教程由四个部分组成。你将在 Azure SQL 托管实例机器学习服务中使用 R 和一个机器学习模型来预测雪橇租赁次数。
假设你有一家雪橇租赁公司,你希望预测未来某个日期的雪橇租赁次数。 此信息可帮助你准备好库存、人员和设施。
在本系列的第一部分,你将设置必备组件。 在第二和第三部分,你将在某个笔记本中开发一些 R 脚本,以准备数据并训练机器学习模型。 然后,在第三部分中,将使用 T-SQL 存储过程在数据库中运行这些 R 脚本。
本文将指导如何进行以下操作:
- 还原示例数据库
在第二部分中,你将了解如何将数据从数据库加载到 Python 数据帧中,并在 R 中准备数据。
在第三部分中,你将了解如何在 R 中训练机器学习模型。
在第四部分中,你将了解如何将模型存储到数据库中,然后通过你在第二和第三部分中开发的 R 脚本来创建存储过程。 存储过程在服务器上运行,以便基于新数据进行预测。
先决条件
- SQL Server 机器学习服务 — 如需安装机器学习服务,请参阅 Windows 安装指南或 Linux 安装指南。 还可以启用 SQL Server 大数据群集上的机器学习服务。
- SQL Server 机器学习服务 - 如需安装机器学习服务,请参阅 Windows 安装指南。
- SQL Server 2016 R 服务 - 如需安装机器学习服务,请参阅 Windows 安装指南。
Azure SQL 托管实例机器学习服务。 有关信息,请参阅 Azure SQL 托管实例机器学习服务概述。
SQL Server Management Studio (SSMS) - 使用 SSMS 将示例数据库还原到 Azure SQL 托管实例。 要下载,请参阅 SQL Server Management Studio。
R IDE - 此教程使用 RStudio Desktop。
RODBC - 此驱动程序用于你在本教程中开发的 R 脚本。 如果尚未安装,请使用 R 命令
install.packages("RODBC")
安装它。 有关 RODBC 的详细信息,请参阅 CRAN - RODBC 包。SQL 查询工具 - 本教程假定使用的是 Azure Data Studio。 有关详细信息,请参阅如何使用 Azure Data Studio 中的笔记本。
还原示例数据库
本教程中使用的示例数据库已保存到 .bak
数据库备份文件,以供下载和使用。
注意
如果在大数据群集上使用机器学习服务,请了解如何将数据库还原成 SQL Server 大数据群集主实例。
下载文件 TutorialDB.bak。
使用以下详细信息,按 Azure Data Studio 中从备份文件还原数据库中的说明操作:
- 从下载的
TutorialDB.bak
文件导入。 - 将目标数据库命名为
TutorialDB
。
- 从下载的
可以通过查询
dbo.rental_data
表来验证是否存在还原的数据集:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
下载文件 TutorialDB.bak。
使用以下详细信息,按 SQL Server Management Studio 中将数据库还原到 Azure SQL 托管实例的说明操作:
- 从下载的
TutorialDB.bak
文件导入。 - 将目标数据库命名为
TutorialDB
。
- 从下载的
可以通过查询
dbo.rental_data
表来验证是否存在还原的数据集:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
清理资源
如果不打算继续学习本教程,请删除 TutorialDB 数据库。
下一步
在本系列教程的第一部分中,你已完成以下步骤:
- 安装必备组件
- 还原示例数据库
若要为机器学习模型准备数据,按本系列教程的第二部分进行操作: