SQL Server 빅 데이터 클러스터 기계 학습 가이드

아티클
04/01/2024

적용 대상: SQL Server 2019(15.x)

이 문서에서는 기계 학습 시나리오에 대해 SQL Server 빅 데이터 클러스터를 사용하는 방법을 설명합니다.

Important

Microsoft SQL Server 2019 빅 데이터 클러스터 추가 기능이 사용 중지됩니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일에 종료됩니다. Software Assurance를 사용하는 SQL Server 2019의 모든 기존 사용자는 플랫폼에서 완전히 지원되며, 소프트웨어는 지원 종료 시점까지 SQL Server 누적 업데이트를 통해 계속 유지 관리됩니다. 자세한 내용은 공지 블로그 게시물 및 Microsoft SQL Server 플랫폼의 빅 데이터 옵션을 참조하세요.

SQL Server 빅 데이터 클러스터에서의 Machine Learning 소개

SQL Server 빅 데이터 클러스터는 다양한 기술 스택(SQL Server Machine Learning Services 및 Apache Spark ML)을 사용하여 기계 학습 시나리오 및 솔루션을 사용하도록 설정합니다.

SQL Server 빅 데이터 클러스터는 SQL Server Machine Learning Services 기술 스택을 사용하여 SQL Server 엔진 내에서 기계 학습 기능을 제공합니다. 이를 통해 데이터베이스 내 고성능 기계 학습 유추 및 채점 시나리오를 사용할 수 있습니다.

빅 데이터 기반 기계 학습 시나리오의 경우 빅 데이터 호스팅 및 Apache Spark ML 기능에 HDFS를 사용하는 것이 좀 더 비용 효율적이고 확장 가능하며 강력한 방식입니다.

기계 학습 시나리오

기계 학습 기능을 사용하면 사기 감지, 예측, 변동, 일반 분류, 회귀 작업 등의 다양한 애플리케이션과 솔루션을 사용할 수 있습니다. 그렇지만 시나리오에 가장 적합한 기술을 사용하는 것이 중요합니다.

측면	SQL Server Machine Learning 서비스	Apache Spark ML
데이터 배치	SQL Server에서 테이블 형식 데이터 지역성을 활용합니다. 프리미엄 데이터 계층입니다.	HDFS를 사용하는 확장 가능한 빅 데이터 계층으로, 비구조화, 반구조화, 구조화 데이터 중 하나입니다.
적합한 대상	짧은 대기 시간 유추 및 채점 시나리오	1. 빅 데이터 위에 분산 일괄 처리 학습 및 채점 기계 학습 모델 2. ML에 대한 ETL 싱크 및 대규모 데이터 준비 및 기능화
피드	ML 기반 BI 대시보드, 보고서, 애플리케이션. 짧은 대기 시간 필요	ML 지원 시나리오 구동을 위해 일괄 처리 채점 데이터를 SQL Server로 승격할 수 있습니다.
대기 시간	짧은 대기 시간 필요	더 긴 대기 시간 허용됨
자세히 알아보기	SQL Server 빅 데이터 클러스터에서 Machine Learning Services를 사용하여 Python 및 R 스크립트 실행	SQL Server 빅 데이터 클러스터에서의 Spark Machine Learning 소개

다음 단계

자세한 내용은 SQL Server 빅 데이터 클러스터 소개를 참조하세요.

다음을 통해 공유

SQL Server 빅 데이터 클러스터 기계 학습 가이드

SQL Server 빅 데이터 클러스터에서의 Machine Learning 소개

기계 학습 시나리오

다음 단계

피드백

추가 리소스