Condividi tramite


Guida di Machine Learning per i cluster Big Data di SQL Server

Si applica a: SQL Server 2019 (15.x)

Questo articolo illustra come usare i cluster Big Data di SQL Server per gli scenari di Machine Learning.

Importante

Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025. Tutti gli utenti esistenti di SQL Server 2019 con Software Assurance saranno completamente supportati nella piattaforma e fino a quel momento il software continuerà a ricevere aggiornamenti cumulativi di SQL Server. Per altre informazioni, vedere il post di blog relativo all'annuncio e Opzioni per i Big Data nella piattaforma Microsoft SQL Server.

Introduzione a Machine Learning nei cluster Big Data di SQL Server

I cluster Big Data di SQL Server offrono scenari e soluzioni di Machine Learning usando stack tecnologici diversi: SQL Server Machine Learning Services e Apache Spark ML.

I cluster Big Data di SQL Server offrono funzionalità di Machine Learning all'interno del motore di SQL Server, usando lo stack di tecnologie SQL Server Machine Learning Services stabilito, consentendo un'inferenza e un punteggio di Machine Learning ad alte prestazioni nel database.

Per gli scenari di Machine Learning basati su Big Data, l'uso di HDFS per l'hosting di Big Data e le funzionalità di Apache Spark ML sono più convenienti, scalabili e potenti.

Scenari di Machine Learning

Le funzionalità di Machine Learning consentono applicazioni e soluzioni diverse, ad esempio rilevamento delle frodi, previsioni, varianza e attività generali di classificazione e regressione. Tuttavia, è importante usare la tecnologia migliore per uno scenario.

Aspetto Machine Learning Services per SQL Server Apache Spark ML
Posizionamento dei dati Sfrutta la località dei dati tabulari in SQL Server. Livello dati Premium. Livello dati Big Data scalabile con HDFS; dati non strutturati, semistrutturati e strutturati.
Ideale per Scenari di assegnazione dei punteggi e inferenza a bassa latenza 1. Training dei batch distribuiti e assegnazione dei punteggi ai modelli di Machine Learning basati su Big Data
2. Sink ETL e preparazione e definizione delle caratteristiche dei dati su larga scala per ML
Feed Dashboard, report e applicazioni di Business Intelligence basati su Machine Learning. Bassa latenza richiesta I dati con punteggio batch possono essere promossi a SQL Server per gestire scenari basati su Machine Learning
Latenza Bassa latenza richiesta Latenza più elevata accettabile
Altre informazioni Eseguire script Python e R con Machine Learning Services in cluster Big Data di SQL Server. Introduzione a machine Learning Spark su cluster Big Data di SQL Server

Passaggi successivi

Per altre informazioni, vedere Introduzione ai cluster Big Data di SQL Server.