Python 자습서: SQL 기계 학습에서 선형 회귀를 사용하여 스키 대여 수량 예측
적용 대상: SQL Server 2017(14.x) 이상 Azure SQL Managed Instance
4부로 구성된 이 자습서 시리즈에서는 SQL Server Machine Learning Services 또는 SQL Server 2019 빅 데이터 클러스터에서 Python 및 선형 회귀를 사용하여 스키 대여 수량을 예측합니다. 이 자습서에서는 Azure Data Studio의 Python Notebook을 사용합니다.
4부로 구성된 이 자습서 시리즈에서는 SQL Server Machine Learning Services에서 Python 및 선형 회귀를 사용하여 스키 대여 수량을 예측합니다. 이 자습서에서는 Azure Data Studio의 Python Notebook을 사용합니다.
4부로 구성된 이 자습서 시리즈에서는 Azure SQL Managed Instance Machine Learning Services에서 Python 및 선형 회귀를 사용하여 스키 대여 수량을 예측합니다. 이 자습서에서는 Azure Data Studio의 Python Notebook을 사용합니다.
스키 대여 사업을 소유하고 있으며 향후 날짜에 임대 횟수를 예측하려 한다고 가정해 봅니다. 이 정보는 재고, 직원 및 시설을 준비하는 데 도움이 됩니다.
이 시리즈의 첫 번째 부분에서는 필수 구성 요소를 설정합니다. 2부 및 3부에서는 데이터를 준비하고 기계 학습 모델을 학습시키기 위해 Notebook에서 몇 가지 Python 스크립트를 개발합니다. 그런 다음 3부에서는 데이터베이스 내부에서 T-SQL 저장 프로시저를 사용하여 Python 스크립트를 실행합니다.
이 문서에서는 다음을 수행하는 방법을 알아봅니다.
- 샘플 데이터베이스 가져오기
2부에서는 데이터베이스의 데이터를 Python 데이터 프레임에 로드하고, Python에서 데이터를 준비하는 방법을 알아봅니다.
3부에서는 Python에서 선형 회귀 모델을 학습하는 방법을 알아봅니다.
4부에서는 모델을 데이터베이스에 저장한 다음, 2부와 3부에서 개발한 Python 스크립트에서 저장 프로시저를 만드는 방법을 알아봅니다. 저장 프로시저는 서버에서 실행되어 새 데이터를 기반으로 예측을 만듭니다.
필수 조건
- SQL Server Machine Learning Services - Machine Learning Services를 설치하려면 Windows 설치 가이드 또는 Linux 설치 가이드를 참조하세요. SQL Server 2019 빅 데이터 클러스터에서 Machine Learning Services를 사용하도록 설정할 수도 있습니다.
- SQL Server Machine Learning Services - Machine Learning Services를 설치하려면 Windows 설치 가이드를 참조하세요.
Azure SQL Managed Instance Machine Learning Services - 자세한 내용은 Azure SQL Managed Instance Machine Learning Services 개요를 참조하세요.
SSMS(SQL Server Management Studio) - SSMS를 사용하여 샘플 데이터베이스를 Azure SQL Managed Instance로 복원합니다. 다운로드하려면 SQL Server Management Studio를 참조하세요.
Python IDE - 이 자습서에서는 Azure Data Studio의 Python Notebook을 사용합니다. 자세한 내용은 Azure Data Studio에서 Notebook을 사용하는 방법을 참조하세요.
SQL 쿼리 도구 - 이 자습서에서는 Azure Data Studio를 사용한다고 가정합니다.
추가 Python 패키지 - 이 자습서 시리즈의 예제에서는 기본적으로 설치되지 않았을 수 있는 다음 Python 패키지를 사용합니다.
- pandas
- pyodbc
- scikit-learn
이러한 패키지를 설치하려면
- Azure Data Studio Notebook에서 패키지 관리를 선택합니다.
- 패키지 관리 창에서 새로 추가 탭을 선택합니다.
- 다음 패키지 각각에 대해 패키지 이름을 입력하고 검색을 선택한 다음 설치를 선택합니다.
또는 명령 프롬프트를 열고 Azure Data Studio에서 사용하는 Python 버전의 설치 경로(예:
cd %LocalAppData%\Programs\Python\Python37-32
)로 변경한 다음 각 패키지에 대해pip install
을 실행할 수 있습니다.
샘플 데이터베이스 복원
이 자습서에 사용되는 샘플 데이터베이스는 .bak
데이터베이스 백업 파일로 저장되었으며, 사용자가 다운로드하여 사용할 수 있습니다.
참고 항목
SQL Server 2019 빅 데이터 클러스터에서 Machine Learning Services를 사용하는 경우 빅 데이터 클러스터 마스터 인스턴스에 데이터베이스 복원을 참조하세요.
TutorialDB.bak 파일을 다운로드합니다.
다음 세부 정보를 사용하여 Azure Data Studio의 백업 파일에서 데이터베이스 복원의 지침을 따릅니다.
- 다운로드한
TutorialDB.bak
파일에서 가져옵니다. - 대상 데이터베이스
TutorialDB
의 이름을 명명합니다.
- 다운로드한
dbo.rental_data
테이블을 쿼리하여 복원된 데이터베이스가 있는지 확인할 수 있습니다.USE TutorialDB; SELECT * FROM [dbo].[rental_data];
TutorialDB.bak 파일을 다운로드합니다.
다음 세부 정보를 사용하여 SQL Server Management Studio에서 데이터베이스를 Azure SQL 관리 인스턴스로 복원의 지침을 따릅니다.
- 다운로드한
TutorialDB.bak
파일에서 가져옵니다. - 대상 데이터베이스
TutorialDB
의 이름을 명명합니다.
- 다운로드한
dbo.rental_data
테이블을 쿼리하여 복원된 데이터베이스가 있는지 확인할 수 있습니다.USE TutorialDB; SELECT * FROM [dbo].[rental_data];
리소스 정리
이 자습서를 계속 진행할 생각이 없으면 TutorialDB
데이터베이스를 삭제하세요.
다음 단계
이 자습서 시리즈의 1부에서는 다음 단계를 완료했습니다.
- 필수 구성 요소 설치
- 샘플 데이터베이스 가져오기
TutorialDB 데이터베이스에서 데이터를 준비하려면 이 자습서 시리즈의 2부를 따릅니다.