SQL Server Python 和 R 教程适用的航空航班到达演示数据
适用于: SQL Server 2016 (13.x) 及更高版本
在此练习中,创建一个 SQL Server 数据库,用于存储从 R 或 Python 内置航空演示数据集导入的数据。 R 和 Python 发行版提供了等效的数据,你可以使用 Management Studio 将这些数据导入到 SQL Server 数据库中。
若要完成此练习,应具有 SQL Server Management Studio 或其他可以运行 T-SQL 查询的工具。
使用此数据集的教程和快速入门包括以下内容:
创建数据库
启动 SQL Server Management Studio,连接到一个具有 R 或 Python 集成的数据库引擎实例。
在对象资源管理器中,单击右键,点击“数据库”,并创建名为“flightdata”的新数据库。
右键单击“flightdata”,单击“任务”和“导入平面文件”。
根据安装的语言,打开 R 或 Python 发行版中提供的 AirlineDemoData csv 文件。
对于 R,请在 C:\Program Files\Microsoft SQL Server\MSSQL14.MSSQLSERVER\R_SERVICES\library\RevoScaleR\SampleData 查找“AirlineDemoSmall.csv”
对于 Python,请在 C:\Program Files\Microsoft SQL Server\MSSQL14.MSSQLSERVER\PYTHON_SERVICES\Lib\site-packages\revoscalepy\data\sample_data 查找“AirlineDemoSmall.csv”
选择该文件时,会为表名称和架构填写默认值。
单击其余页面,接受默认值以导入数据。
查询数据
作为验证步骤,运行查询以确认已上传数据。
在“对象资源管理器”中的“数据库”下,右键单击“flightdata”数据库,然后启动一个新查询。
运行一些简单的查询:
SELECT TOP(10) * FROM AirlineDemoSmall; SELECT COUNT(*) FROM AirlineDemoSmall;
后续步骤
在下一课程中,将基于此数据创建线性回归模型。