SQL Server Python 및 R 자습서에 대한 항공 비행 도착 데모 데이터
적용 대상: SQL Server 2016(13.x) 이상 버전
이 연습에서는 R 또는 Python 기본 제공 Airline 데모 데이터 세트에서 가져온 데이터를 저장할 SQL Server 데이터베이스를 만듭니다. R 및 Python 배포는 Management Studio를 사용하여 SQL Server 데이터베이스로 가져올 수 있는 동일한 데이터를 제공합니다.
이 연습을 완료하려면 SQL Server Management Studio 또는 T-SQL 쿼리를 실행할 수 있는 다른 도구가 있어야 합니다.
이 데이터 세트를 사용하는 자습서 및 빠른 시작에는 다음이 포함됩니다.
데이터베이스 생성
SQL Server Management Studio를 시작하고 R 또는 Python 통합을 포함하는 데이터베이스 엔진 인스턴스에 연결합니다.
개체 탐색기에서 데이터베이스를 마우스 오른쪽 단추로 클릭하고 flightdata라는 새 데이터베이스를 만듭니다.
flightdata를 마우스 오른쪽 단추로 클릭하고, 작업 및 플랫 파일 가져오기를 차례로 클릭합니다.
설치한 언어에 따라 R 또는 Python 배포에 제공된 AirlineDemoData.csv 파일을 엽니다.
R의 경우 C:\Program Files\Microsoft SQL Server\MSSQL14.MSSQLSERVER\R_SERVICES\library\RevoScaleR\SampleData에서 AirlineDemoSmall.csv를 찾습니다.
Python의 경우 C:\Program Files\Microsoft SQL Server\MSSQL14.MSSQLSERVER\PYTHON_SERVICES\Lib\site-packages\revoscalepy\data\sample_data에서 AirlineDemoSmall.csv를 찾습니다.
파일을 선택하면 테이블 이름 및 스키마에 대한 기본값이 채워집니다.
나머지 페이지를 클릭하고 기본값을 적용하여 데이터를 가져옵니다.
데이터 쿼리
유효성 검사 단계로, 쿼리를 실행하여 데이터가 업로드되었는지 확인합니다.
개체 탐색기의 데이터베이스에서 flightdata 데이터베이스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 시작합니다.
몇 가지 간단한 쿼리를 실행합니다.
SELECT TOP(10) * FROM AirlineDemoSmall; SELECT COUNT(*) FROM AirlineDemoSmall;
다음 단계
다음 단원에서는 이 데이터를 기반으로 선형 회귀 모델을 만듭니다.