Guida di Machine Learning per i cluster Big Data di SQL Server
Si applica a: SQL Server 2019 (15.x)
Questo articolo illustra come usare i cluster Big Data di SQL Server per gli scenari di Machine Learning.
Importante
Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025. Tutti gli utenti esistenti di SQL Server 2019 con Software Assurance saranno completamente supportati nella piattaforma e fino a quel momento il software continuerà a ricevere aggiornamenti cumulativi di SQL Server. Per altre informazioni, vedere il post di blog relativo all'annuncio e Opzioni per i Big Data nella piattaforma Microsoft SQL Server.
Introduzione a Machine Learning nei cluster Big Data di SQL Server
I cluster Big Data di SQL Server offrono scenari e soluzioni di Machine Learning usando stack tecnologici diversi: SQL Server Machine Learning Services e Apache Spark ML.
I cluster Big Data di SQL Server offrono funzionalità di Machine Learning all'interno del motore di SQL Server, usando lo stack di tecnologie SQL Server Machine Learning Services stabilito, consentendo un'inferenza e un punteggio di Machine Learning ad alte prestazioni nel database.
Per gli scenari di Machine Learning basati su Big Data, l'uso di HDFS per l'hosting di Big Data e le funzionalità di Apache Spark ML sono più convenienti, scalabili e potenti.
Scenari di Machine Learning
Le funzionalità di Machine Learning consentono applicazioni e soluzioni diverse, ad esempio rilevamento delle frodi, previsioni, varianza e attività generali di classificazione e regressione. Tuttavia, è importante usare la tecnologia migliore per uno scenario.
Aspetto | Machine Learning Services per SQL Server | Apache Spark ML |
---|---|---|
Posizionamento dei dati | Sfrutta la località dei dati tabulari in SQL Server. Livello dati Premium. | Livello dati Big Data scalabile con HDFS; dati non strutturati, semistrutturati e strutturati. |
Ideale per | Scenari di assegnazione dei punteggi e inferenza a bassa latenza | 1. Training dei batch distribuiti e assegnazione dei punteggi ai modelli di Machine Learning basati su Big Data 2. Sink ETL e preparazione e definizione delle caratteristiche dei dati su larga scala per ML |
Feed | Dashboard, report e applicazioni di Business Intelligence basati su Machine Learning. Bassa latenza richiesta | I dati con punteggio batch possono essere promossi a SQL Server per gestire scenari basati su Machine Learning |
Latenza | Bassa latenza richiesta | Latenza più elevata accettabile |
Altre informazioni | Eseguire script Python e R con Machine Learning Services in cluster Big Data di SQL Server. | Introduzione a machine Learning Spark su cluster Big Data di SQL Server |
Passaggi successivi
Per altre informazioni, vedere Introduzione ai cluster Big Data di SQL Server.