데이터를 수집하여 SQL Server Machine Learning Services의 Python 및 R 스크립트 문제 해결
적용 대상: SQL Server 2016(13.x) 이상 버전
중요
Machine Learning Server(이전의 R Server) 지원은 2022년 7월 1일에 종료되었습니다. 자세한 내용은 Machine Learning Server는 어떻게 되나요?를 참조하세요.
이 문서에서는 SQL Server Machine Learning Services의 문제를 해결할 때 필요한 데이터를 수집하는 방법을 설명합니다. 이 데이터는 사용자가 직접 문제를 해결하든 Microsoft 고객 지원팀의 도움을 받든 상관없이 유용할 수 있습니다.
SQL Server 버전 및 에디션
SQL Server 2016 R Services는 통합 R 지원을 포함하는 SQL Server의 첫 번째 릴리스입니다. SQL Server 2016 SP1(서비스 팩 1)에는 외부 스크립트를 실행하는 기능을 비롯한 몇 가지 주요 개선 사항이 포함되어 있습니다. SQL Server 2016을 사용하는 경우 SP1 이상을 설치하는 것을 고려해야 합니다.
SQL Server 2017 이상에는 Python 언어 통합이 있습니다. 이전 릴리스에서는 Python 기능 통합을 가져올 수 없습니다.
사용 중인 SQL Server 버전에 따라 일부 기계 학습 기능을 사용할 수 없거나 제한될 수 있습니다.
R 언어 및 도구 버전
일반적으로 R Services 기능 또는 Machine Learning Services 기능을 선택할 때 설치되는 Microsoft R 버전은 SQL Server 빌드 번호에 의해 결정됩니다. SQL Server를 업그레이드하거나 패치하는 경우 R 구성 요소도 업그레이드하거나 패치해야 합니다.
릴리스 목록과 R 구성 요소 다운로드에 대한 링크는 인터넷에 액세스하지 않고 기계 학습 구성 요소 설치를 참조하세요. 인터넷에 액세스할 수 있는 컴퓨터에서는 필요한 R 버전이 자동으로 식별되고 설치됩니다.
바인딩이라는 하는 프로세스에서 SQL Server 데이터베이스 엔진과 별도로 R 서버 구성 요소를 업그레이드할 수 있습니다. 따라서 SQL Server에서 R 코드를 실행할 때 사용하는 R 버전은 설치된 SQL Server 버전과 서버를 최신 R 버전으로 마이그레이션했는지 여부에 따라 다를 수 있습니다.
R 버전 확인
R 버전을 확인하는 가장 쉬운 방법은 다음과 같은 명령문을 실행하여 런타임 속성을 가져오는 것입니다.
EXECUTE sp_execute_external_script
@language = N'R'
, @script = N'
# Transform R version properties to data.frame
OutputDataSet <- data.frame(
property_name = c("R.version", "Revo.version"),
property_value = c(R.Version()$version.string, Revo.version$version.string),
stringsAsFactors = FALSE)
# Retrieve properties like R.home, libPath & default packages
OutputDataSet <- rbind(OutputDataSet, data.frame(
property_name = c("R.home", "libPaths", "defaultPackages"),
property_value = c(R.home(), .libPaths(), paste(getOption("defaultPackages"), collapse=", ")),
stringsAsFactors = FALSE)
)
'
WITH RESULT SETS ((PropertyName nvarchar(100), PropertyValue nvarchar(4000)));
팁
R Services가 작동하지 않는 경우 RGui에서 R 스크립트 부분만 실행해 보세요.
마지막 수단으로 서버에서 파일을 열어 설치된 버전을 확인할 수 있습니다. 이렇게 하려면 rlauncher.config 파일을 찾아 R 런타임 및 현재 작업 디렉터리의 위치를 가져옵니다. 실수로 속성을 변경하지 않도록 파일의 복사본을 만들고 여는 것이 좋습니다.
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.<instance_name\MSSQL\Binn\rlauncher.config
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\MSSQL\Binn\rlauncher.config
R 버전 및 RevoScaleR 버전을 가오려면 R 명령 프롬프트를 열거나 인스턴스와 연결된 RGui를 엽니다.
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.<instancename>\R_SERVICES\bin\x64\RGui.exe
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\R_SERVICES\bin\x64\RGui.exe
R 콘솔은 시작 시 버전 정보를 표시합니다. 예를 들어 다음 버전은 SQL Server 2017의 기본 구성을 나타냅니다.
*Microsoft R Open 3.3.3*
*The enhanced R distribution from Microsoft*
*Microsoft packages Copyright (C) 2017 Microsoft*
*Loading Microsoft R Server packages, version 9.1.0.*
Python 버전
Python 버전을 가져오는 방법에는 여러 가지가 있습니다. 가장 쉬운 방법은 Management Studio 또는 다른 SQL 쿼리 도구에서 이 명령문을 실행하는 것입니다.
-- Get Python runtime properties:
exec sp_execute_external_script
@language = N'Python'
, @script = N'
import sys
import pkg_resources
OutputDataSet = pandas.DataFrame(
{"property_name": ["Python.home", "Python.version", "Revo.version", "libpaths"],
"property_value": [sys.executable[:-10], sys.version, pkg_resources.get_distribution("revoscalepy").version, str(sys.path)]}
)
'
with WITH RESULT SETS (SQL keywords) ((PropertyName nvarchar(100), PropertyValue nvarchar(4000)));
Machine Learning Services가 실행되고 있지 않으면 pythonlauncher.config 파일을 보고 설치된 Python 버전을 확인할 수 있습니다. 실수로 속성을 변경하지 않도록 파일의 복사본을 만들고 여는 것이 좋습니다.
- SQL Server 2017에만 해당:
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\MSSQL\Log\ExtensibilityLog\pythonlauncher.config
- PYTHONHOME에 대한 값을 가져옵니다.
- 현재 작업 디렉터리의 값을 가져옵니다.
참고
SQL Server 2017에 Python과 R을 모두 설치한 경우 작업 디렉터리와 작업자 계정의 풀이 R 및 Python 언어에 대해 공유됩니다.
R 또는 Python의 여러 인스턴스가 설치되어 있나요?
컴퓨터에 R 라이브러리의 복사본이 둘 이상 설치되어 있는지 확인합니다. 이 중복은 다음과 같은 경우에 발생할 수 있습니다.
- 설치하는 동안 R Services(데이터베이스 내)와 R 서버(독립 실행형)를 모두 선택합니다.
- SQL Server 외에도 Microsoft R Client를 설치합니다.
- Visual Studio, R Studio, Microsoft R Client 또는 다른 R IDE용 R 도구를 사용하여 다른 R 라이브러리 세트를 설치했습니다.
- 컴퓨터는 SQL Server의 여러 인스턴스를 호스팅하며 둘 이상의 인스턴스가 기계 학습을 사용합니다.
Python에도 동일한 조건이 적용됩니다.
여러 라이브러리나 런타임이 설치되어 있는 경우 SQL Server 인스턴스에서 사용되는 Python 또는 R 런타임과 관련된 오류만 표시되는지 확인합니다.
오류의 출처
R 코드를 실행하려고 할 때 표시되는 오류는 다음 원본 중 하나에서 발생할 수 있습니다.
- 저장 프로시저 sp_execute_external_script를 포함한 SQL Server 데이터베이스 엔진
- SQL Server 신뢰할 수 있는 실행 패드
- R 및 Python 시작 관리자 및 위성 프로세스를 비롯한 확장성 프레임워크의 기타 구성 요소
- Microsoft ODBC(Open Database Connectivity)와 같은 공급자
- R 언어
서비스를 처음 사용할 때 어떤 메시지가 어떤 서비스에서 유래되었는지 구별하기가 어려울 수 있습니다. 정확한 메시지 텍스트뿐만 아니라 메시지를 확인한 컨텍스트를 캡처하는 것이 좋습니다. 기계 학습 코드를 실행하는 데 사용하는 클라이언트 소프트웨어를 참고하세요.
- Management Studio를 사용하고 있나요? 외부 애플리케이션인가요?
- 원격 클라이언트에서 R 코드를 실행하고 있나요? 아니면 저장 프로시저에서 직접 실행하고 있나요?
SQL Server 로그 파일
최신 SQL Server ERRORLOG를 가져옵니다. 전체 오류 로그 세트는 다음 기본 로그 디렉터리의 파일로 구성됩니다.
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.SQL2016\MSSQL\Log\ExtensibilityLog
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.SQL2016\MSSQL\Log\ExtensibilityLog
참고
정확한 폴더 이름은 인스턴스 이름에 따라 달라집니다.
sp_execute_external_script에서 반환된 오류
sp_execute_external_script 명령을 실행할 때 반환되는 오류의 전체 텍스트를 가져옵니다(있는 경우).
R 또는 Python 문제를 고려하지 않으려면 R 또는 Python 런타임을 시작하고 데이터를 앞뒤로 전달하는 이 스크립트를 실행하면 됩니다.
R의 경우
exec sp_execute_external_script @language =N'R',
@script=N'OutputDataSet<-InputDataSet',
@input_data_1 =N'select 1 as hello'
with result sets (([hello] int not null));
go
Python의 경우
exec sp_execute_external_script @language =N'Python',
@script=N'OutputDataSet= InputDataSet',
@input_data_1 =N'select 1 as hello'
with result sets (([hello] int not null));
go
확장성 프레임워크에서 생성된 오류
SQL Server는 외부 스크립트 언어 런타임에 대해 별도의 로그를 생성합니다. 이러한 오류는 Python 또는 R 언어에서 생성되지 않습니다. 이러한 구성 요소는 언어별 시작 관리자와 해당 위성 프로세스를 포함하여 SQL Server의 확장성 구성 요소에서 생성됩니다.
이러한 로그는 다음과 같은 기본 위치에서 가져올 수 있습니다.
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.<instance_name>\MSSQL\Log\ExtensibilityLog
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\MSSQL\Log\ExtensibilityLog
참고
정확한 폴더 이름은 인스턴스 이름에 따라 다릅니다. 구성에 따라 폴더가 다른 드라이브에 있을 수 있습니다.
예를 들어 다음 로그 메시지는 확장성 프레임워크와 관련이 있습니다.
사용자 MSSQLSERVER01에 대한 LogonUser가 실패함
이는 외부 스크립트를 실행하는 작업자 계정이 인스턴스에 액세스할 수 없음을 나타낼 수 있습니다.
InitializePhysicalUsersPool 실패
이 메시지는 보안 설정으로 인해 외부 스크립트를 실행하는 데 필요한 작업자 계정 풀이 생성되지 않음을 의미할 수 있습니다.
보안 컨텍스트 관리자 초기화 실패
위성 세션 관리자 초기화 실패
시스템 이벤트
- Windows 이벤트 뷰어를 열고 시스템 이벤트 로그에서 실행 패드 문자열을 포함하는 메시지를 검색합니다.
- ExtLaunchErrorlog 파일을 열고 ErrorCode 문자열을 찾습니다. ErrorCode와 연결된 메시지를 검토합니다.
예를 들어 다음 메시지는 SQL Server 확장성 프레임워크와 관련된 일반적인 시스템 오류입니다.
다음(<text>) 오류로 인해 SQL Server 실행 패드(MSSQLSERVER) 서비스를 시작하지 못했습니다.
서비스가 적절한 시간 내에 시작 또는 제어 요청에 응답하지 않았습니다.
SQL Server 실행 패드(MSSQLSERVER) 서비스가 연결되기를 기다리는 동안 제한 시간(120000 밀리초)에 도달했습니다.
덤프 파일
디버깅에 대해 잘 알고 있는 경우 덤프 파일을 사용하여 실행 패드에서 오류를 분석할 수 있습니다.
- SQL Server에 대한 설치 부트스트랩 로그가 포함된 폴더를 찾습니다. 예를 들어 SQL Server 2016에서 기본 경로는 C:\Program Files\Microsoft SQL Server\130\Setup Bootstrap\Log입니다.
- 확장성과 관련된 부트스트랩 로그 하위 폴더를 엽니다.
- 지원 요청을 제출해야 하는 경우 이 폴더의 전체 내용을 압축된 파일에 추가합니다. 예: C:\Program Files\Microsoft SQL Server\130\Setup Bootstrap\Log\LOG\ExtensibilityLog.
정확한 위치는 시스템마다 다를 수 있으며, C 드라이브가 아닌 다른 드라이브에 있을 수 있습니다. 기계 학습이 설치된 인스턴스에 대한 로그를 가져와야 합니다.
구성 설정
이 섹션에는 R 또는 Python 스크립트를 실행할 때 오류의 원인이 될 수 있는 추가 구성 요소 또는 공급자가 나열되어 있습니다.
사용 가능한 네트워크 프로토콜은 무엇인가요?
Machine Learning Services에는 확장성 구성 요소 간의 내부 통신과 외부 R 또는 Python 클라이언트와의 통신을 위해 다음과 같은 네트워크 프로토콜이 필요합니다.
- 명명된 파이프
- TCP/IP
SQL Server 구성 관리자를 열어 프로토콜이 설치되어 있는지 여부를 확인하고 설치된 경우 사용 여부를 확인합니다.
보안 구성 및 사용 권한
작업자 계정의 경우:
- 제어판에서 사용자 및 그룹을 열고 외부 스크립트 작업을 실행하는 데 사용되는 그룹을 찾습니다. 기본적으로 그룹은 SQLRUserGroup입니다.
- 그룹이 있고 하나 이상의 작업자 계정이 포함되어 있는지 확인합니다.
- SQL Server Management Studio에서 R 또는 Python 작업이 실행될 인스턴스를 선택하고 Security를 선택한 다음, SQLRUserGroup에 대한 로그온이 있는지 여부를 확인합니다.
- 사용자 그룹에 대한 사용 권한을 검토합니다.
개별 사용자 계정의 경우:
인스턴스가 혼합 모드 인증, SQL 로그인만 지원하는지 또는 Windows 인증만 지원하는지 여부를 확인합니다. 이 설정은 R 또는 Python 코드 요구 사항에 영향을 줍니다.
R 코드를 실행해야 하는 각 사용자에 대해 R에서 개체를 작성하거나 데이터에 액세스하거나, 개체를 생성할 각 데이터베이스에 필요한 권한 수준을 결정합니다.
스크립트 실행을 사용하도록 설정하려면 필요에 따라 역할을 만들거나 다음 역할에 사용자를 추가합니다.
- db_owner를 제외한 모든 항목: 모든 외부 스크립트를 실행해야 합니다.
- db_datawriter: R 또는 Python에서 결과를 작성합니다.
- db_ddladmin: 새 개체를 만듭니다.
- db_datareader: R 또는 Python 코드에서 사용되는 데이터를 읽습니다.
SQL Server 2016을 설치할 때 기본 시작 계정을 변경했는지 여부를 확인합니다.
사용자가 새 R 패키지를 설치하거나 다른 사용자가 설치한 R 패키지를 사용해야 하는 경우 인스턴스에서 패키지 관리를 활성화한 다음, 추가 권한을 할당해야 합니다.
바이러스 백신 소프트웨어로 어떤 폴더를 잠글 수 있나요?
바이러스 백신 소프트웨어는 폴더를 잠글 수 있으므로 기계 학습 기능의 설정과 성공적인 스크립트 실행을 모두 방지할 수 있습니다. SQL Server 트리에 있는 모든 폴더가 바이러스 검사 대상인지 여부를 확인합니다.
그러나 인스턴스에 여러 서비스나 기능이 설치되어 있는 경우 인스턴스에서 사용되는 모든 가능한 폴더를 열거하기 어려울 수 있습니다. 예를 들어 새 기능을 추가할 때 새 폴더를 식별하고 제외해야 합니다.
또한 일부 기능은 런타임에 동적으로 새 폴더를 만듭니다. 예를 들어 메모리 내 OLTP 테이블, 저장 프로시저 및 함수는 모두 런타임에 새 디렉터리를 만듭니다. 이러한 폴더 이름은 종종 GUID를 포함하며 예측할 수 없습니다. SQL Server 신뢰할 수 있는 실행 패드는 R 및 Python 스크립트 작업에 대한 새 작업 디렉터리를 만듭니다.
SQL Server 프로세스 및 해당 기능에 필요한 모든 폴더를 제외할 수 없으므로 전체 SQL Server 인스턴스 디렉터리 트리를 제외하는 것이 좋습니다.
SQL Server에 대해 방화벽이 열려 있나요? 인스턴스가 원격 연결을 지원하나요?
SQL Server가 원격 연결을 지원하는지 여부를 확인하려면 원격 서버 연결 구성을 참조하세요.
SQL Server에 대한 방화벽 규칙이 생성되었는지 여부를 확인합니다. 보안상의 이유로 기본 설치에서는 원격 R 또는 Python 클라이언트가 인스턴스에 연결하지 못할 수 있습니다. 자세한 내용은 SQL Server에 연결 문제 해결을 참조하세요.