Riepilogo
In questo modulo si è appreso come usare Python per esplorare, visualizzare e modificare i dati. L'esplorazione dei dati è alla base della data science ed è un elemento fondamentale nell'analisi dei dati e nell'apprendimento automatico.
L’apprendimento automatico è un subset di data science che riguarda la modellazione predittiva. In altre parole, nel Machine Learning si ricorre ai dati per creare modelli predittivi e stimare così valori sconosciuti. È possibile usare uno strumento di Machine Learning per stimare, ad esempio, la quantità di cibo che un supermercato deve ordinare o per identificare le piante in un insieme di fotografie.
Il Machine Learning si basa sulla capacità di identificare le relazioni tra i valori di dati che descrivono le caratteristiche di un elemento, ad esempio l'altezza e il colore di una pianta, e il valore che si vuole stimare (ossia l'etichetta), ad esempio la specie della pianta. Queste relazioni vengono integrate in un modello tramite un processo di training.
Sfida: Analizzare dati sui voli
Negli esercizi di questo modulo sono stati esplorati set di dati per scopi personali, ma perché non affrontare la sfida di un set di dati reale sui voli messo a disposizione dal Dipartimento dei trasporti degli Stati Uniti? Questa sfida è disponibile nel notebook 01 - Flights Challenge.ipynb.
Nota
Il tempo necessario per portare a termine questa sfida facoltativa non è incluso nel tempo stimato per questo modulo di formazione. È possibile dedicare alla sfida tutto il tempo necessario.