Поделиться через


Демонстрационные данные по прибытию авиарейсов для учебников по SQL Server Python и R

Область применения: SQL Server 2016 (13.x) и более поздних версий

В этом упражнении мы создадим базу данных SQL Server для хранения данных, импортированных из встроенных демонстрационных наборов данных по авиарейсам R или Python. В дистрибутивах для R и Python представлены одинаковые данные, которые можно импортировать в базу данных SQL Server с помощью Management Studio.

Для выполнения этого упражнения вам потребуется SQL Server Management Studio или другое средство, поддерживающее выполнение запросов T-SQL.

Этот набор данных используется в следующих учебниках и кратких руководствах:

Создание базы данных

  1. Запустите SQL Server Management Studio и установите подключение к экземпляру ядра СУБД, обеспечивающего интеграцию с R или Python.

  2. В обозревателе объектов щелкните правой кнопкой мыши элемент Базы данных и создайте новую базу данных с названием flightdata.

  3. Щелкните правой кнопкой мыши объект flightdata, а затем выберите Задачи и Импортировать неструктурированный файл.

  4. Откройте файл AirlineDemoData.csv, входящий в состав дистрибутива R или Python, в зависимости от используемого языка.

    Для R вам потребуется файл AirlineDemoSmall.csv из каталога C:\Program Files\Microsoft SQL Server\MSSQL14.MSSQLSERVER\R_SERVICES\library\RevoScaleR\SampleData

    Для Python найдите файл AirlineDemoSmall.csv в каталоге C:\Program Files\Microsoft SQL Server\MSSQL14.MSSQLSERVER\PYTHON_SERVICES\Lib\site-packages\revoscalepy\data\sample_data

При выборе файла автоматически заполняются значениями по умолчанию поля, определяющие имя таблицы и схему.

Мастер импорта неструктурированных файлов со значениями по умолчанию для демонстрационных данных по авиарейсам

Перейдите по всем оставшимся страницам, принимая заданные по умолчанию значения, чтобы импортировать данные.

Запрос данных

Для проверки выполните запрос и убедитесь, что данные были отправлены.

  1. В разделе "Базы данных" обозревателя объектов щелкните правой кнопкой мыши базу flightdata и запустите новый запрос.

  2. Выполните несколько простых запросов:

    SELECT TOP(10) * FROM AirlineDemoSmall;
    SELECT COUNT(*) FROM AirlineDemoSmall;
    

Следующие шаги

В рамках следующего занятия вы создадите модель линейной регрессии на основе этих данных.