Resumen

Completado

En este módulo, ha aprendido a usar Python para explorar, visualizar y manipular datos. La exploración de datos es la base de la ciencia de datos y un elemento clave en el análisis de datos y el aprendizaje automático.

El aprendizaje automático es un subconjunto de la ciencia de datos que se ocupa del modelado predictivo. En otras palabras, el aprendizaje automático usa datos para crear modelos predictivos, con el fin de predecir valores desconocidos. Podría utilizar el aprendizaje automático para predecir la cantidad de alimentos que debe pedir un supermercado, o para identificar plantas en fotografías.

Lo que hace el aprendizaje automático es identificar las relaciones entre los valores de datos que describen las propiedades de algo, (sus características, como la altura y el color de una planta), y el valor que se quiere predecir (la etiqueta, como las especies de plantas). Estas relaciones se integran en un modelo a través de un proceso de entrenamiento.

Reto: Análisis de datos de vuelos

Si los ejercicios de este módulo le han inspirado para intentar explorar los datos por sí mismo, ¿por qué no acepta el reto de un conjunto de datos del mundo real que contenga registros de vuelos del Departamento de Transporte de Estados Unidos? Encontrará el reto en el cuaderno 01 - Flights Challenge.ipynb.

Nota:

El tiempo para completar este desafío opcional no se incluye en el tiempo estimado para este módulo de formación. Puede dedicarle tanto tiempo como quiera.