Moduli di Machine Learning in ML Studio (versione classica)
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Il flusso di lavoro tipico di Machine Learning include molte fasi:
Identificazione di un problema da risolvere e di una metrica per la misurazione dei risultati.
Ricerca, pulizia e preparazione dei dati appropriati.
Identificazione delle migliori funzionalità e progettazione di nuove funzionalità.
Compilazione, valutazione e ottimizzazione di modelli.
Uso di modelli per generare stime, raccomandazioni e altri risultati.
I moduli di questa sezione forniscono strumenti per le fasi finali di Machine Learning, in cui si applica un algoritmo ai dati per eseguire il training di un modello. In queste fasi finali si generano anche punteggi e quindi si valuta l'accuratezza e l'utilità del modello.
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Elenco di attività di Machine Learning per categoria
-
È possibile scegliere tra un'ampia gamma di algoritmi di Machine Learning personalizzabili, tra cui clustering, regressione, classificazione e rilevamento anomalie .
-
Fornire i dati al modello configurato per apprendere dai modelli e creare statistiche che possono essere usate per le stime.
-
Creare stime usando i modelli con training.
-
Misurare l'accuratezza di un modello con training o confrontare più modelli.
Per una descrizione dettagliata di questo flusso di lavoro sperimentale, vedere la procedura dettagliata relativa alla soluzione di rischio di credito.
Prerequisiti
Prima di poter ottenere la parte divertente della compilazione di un modello, in genere è necessaria una grande quantità di preparazione. Questa sezione contiene collegamenti agli strumenti di Machine Learning Studio (versione classica) che consentono di pulire i dati, migliorare la qualità dell'input e prevenire gli errori di runtime.
Esplorazione dei dati e qualità dei dati
Assicurarsi che i dati siano il tipo di dati giusto, la quantità giusta e la qualità giusta per l'algoritmo scelto. Comprendere la quantità di dati e la modalità di distribuzione. Sono presenti outlier? Come sono stati generati e cosa significano? Sono presenti record duplicati?
Gestire i valori mancanti
I valori mancanti possono influire sui risultati in vari modi. Ad esempio, quasi tutti i metodi statistici eliminano i casi con valori mancanti. Per impostazione predefinita, Machine Learning regole quando rileva righe con valori mancanti:
Se i dati usati per il training di un modello hanno valori mancanti, qualsiasi riga con valori mancanti verrà ignorata.
Se i dati usati come input per l'assegnazione di punteggi a un modello hanno valori mancanti, i valori mancanti vengono usati come input, ma i valori Null vengono propagati. Ciò significa in genere che nei risultati viene inserito un valore Null anziché una stima valida.
Assicurarsi di controllare i dati prima di eseguire il training del modello. Per imputare i valori mancanti o correggere i dati, usare questo modulo:
- Clean Missing Data (Pulisci dati mancanti)
Selezionare le caratteristiche e ridurre la dimensionalità
Machine Learning Studio (versione classica) consente di setaggiare i dati per trovare gli attributi più utili.
Usare strumenti come Fisher Linear Discriminant Analysis o Filter Based Feature Selection per determinare quali colonne di dati hanno la maggiore potenza predittiva. Questi strumenti possono anche identificare le colonne che devono essere rimosse a causa di perdite di dati.
Creare o progettare funzioni in base a dati esistenti. Normalizzare i datio raggrupparli in contenitori per creare nuovi raggruppamenti di dati o standardizzare l'intervallo di valori numerici prima dell'analisi.
Ridurre la dimensionalità raggruppando i valori categorici, usando l'analisi del componente principale o il campionamento.
Esempio
Per esempi di Machine Learning in azione, vedere l'Azure AI Gallery.
Per suggerimenti e una procedura dettagliata di alcune attività tipiche di preparazione dei dati, vedere Procedure dettagliate per l'esecuzione del processo di data science per i team.