Data mining (SSAS)
In Analysis Services è disponibile una piattaforma integrata per le soluzioni in cui è incorporato il data mining. Per creare soluzioni di Business Intelligence con analisi predittiva è possibile utilizzare i dati relazionali o del cubo.
Vantaggi del data mining
Nel data mining vengono utilizzati principi statistici analizzati in modo approfondito per individuare modelli nei dati, consentendo di prendere decisioni intelligenti sui problemi complessi. Applicando gli algoritmi di data mining di Analysis Services ai dati, è possibile prevedere tendenze, identificare modelli, creare regole e indicazioni, analizzare la sequenza di eventi in set di dati complessi e acquisire nuovi approfondimenti.
In SQL Server 2012 il data mining è efficace, accessibile e integrato con gli strumenti preferiti dagli utenti per l'analisi e la creazione di report. Per ottenere un'utile panoramica generale sul data mining che si desidera avviare, vedere i collegamenti di questa sezione.
Caratteristiche principali del data mining
In SQL Server sono disponibili le caratteristiche seguenti per il supporto di soluzioni di data mining integrate:
Più origini dei dati: non è necessario creare un data warehouse o un cubo OLAP per eseguire il data mining. È possibile utilizzare dati tabulari forniti da provider esterni o disponibili in fogli di calcolo o addirittura file di testo, nonché eseguire in modo semplice il data mining di cubi OLAP creati in Analysis Services. Tuttavia, non è possibile usare i dati di un database in memoria.
Pulizia dati, gestione dati e processi di estrazione, trasformazione e caricamento (ETL) integrati: Data Quality Services fornisce strumenti avanzati per il profiling e la pulizia dei dati. Integration Services può essere utilizzato per compilare processi ETL per la pulizia dei dati, nonché per la compilazione, l'elaborazione, il training e l'aggiornamento di modelli.
Più algoritmi personalizzabili: oltre a fornire algoritmi quali quelli di clustering, reti neurali e alberi delle decisioni, la piattaforma supporta lo sviluppo di algoritmi plug-in personalizzati.
Infrastruttura di test del modello: testare i modelli e i set di dati usando importanti strumenti statistici come la convalida incrociata, le matrici di classificazione, i grafici di accuratezza e a dispersione. Creare e gestire facilmente i set di testing e di training.
Esecuzione di query e drill-through: creare query di stima, recuperare schemi e statistiche del modello ed eseguire il drill-through nei dati del case.
Strumenti client: oltre agli strumenti di sviluppo e progettazione forniti da SQL Server, è possibile usare i componenti aggiuntivi Data mining per Excel per creare ed esplorare i modelli, nonché per eseguirvi query. In alternativa creare client personalizzati, inclusi i servizi Web.
Supporto del linguaggio di scripting e API gestita: tutti gli oggetti di data mining sono completamente programmabili. La generazione di script è possibile tramite MDX, XMLA o le estensioni PowerShell per Analysis Services. Utilizzare il linguaggio DMX (Data Mining Extensions) per eseguire query e generare script velocemente.
Sicurezza e distribuzione: tramite Analysis Services viene fornita la sicurezza basata su ruoli, incluse autorizzazioni separate relative al drill-through per i dati del modello e della struttura. Distribuzione semplice di modelli agli altri server, in modo che gli utenti possano accedere agli schemi o effettuare stime
Contenuto della sezione
Negli argomenti di questa sezione sono illustrate le caratteristiche principali di Data mining di SQL Server e le attività correlate.