Exploración de los datos de lanzamiento de cohetes para entenderlos
Los modelos de Machine Learning se entrenan con datos suficientes para evitar errores. Sin datos suficientes, es posible que un modelo de Machine Learning sea demasiado general.
Por ejemplo, si ha entrenado un modelo de Machine Learning con datos de temperatura, es posible que no detecte que la precipitación es más importante y que no siempre se correlaciona con temperaturas bajas en Florida, Estados Unidos. En ese caso, el modelo podría indicar que es seguro lanzar un cohete en un día con una temperatura buena pero demasiadas precipitaciones, lo cual no sería seguro.
Recopilación de datos
El primer paso en cualquier solución de ciencia de datos o aprendizaje automático consiste en recopilar y comprender los datos. En esta ruta de aprendizaje, se han recopilado datos meteorológicos disponibles de forma pública en NOAA y Weather Underground para las fechas de lanzamiento de cohetes de la NASA tomadas de la lista de misiones de la NASA en Wikipedia. Después, compilamos estos datos en un archivo de Excel.
Seleccione este vínculo de archivo de Excel para descargar el archivo. Lo usaremos para los ejercicios de este módulo.
El archivo de Excel contiene los datos meteorológicos de los días de lanzamientos individuales tripulados y no tripulados. También se han agregado datos de los dos días que rodean a los lanzamientos para comprobar si hay algún patrón interesante. Esta es una captura de pantalla del archivo de Excel.
Datos que faltan
El archivo de Excel tiene abundantes datos sobre cada lanzamiento. Pero a medida que empiece a explorar estos datos, es posible que encuentre un problema importante. Solo una fila representa un lanzamiento de cohete que supuestamente debía haberse realizado pero que se aplazó debido a problemas meteorológicos:
Fila 294: Space X Dragon; 27 de mayo de 2020
Una lista de todos los lanzamientos intentados pero pospuestos debido al tiempo no es tan fácil de detectar como la lista de lanzamientos correctos. Las fechas que se tuvieron en cuenta pero que se cambiaron antes del anuncio de la fecha prevista para el lanzamiento tampoco son fáciles de detectar.
Expertos en la materia
El 45th Space Wing de las Fuerzas Aéreas de Estados Unidos tiene una misión: "Aprovechar el clima para garantizar un acceso seguro al aire y al espacio". En combinación con las mentes de la NASA, la probabilidad de elegir una fecha que se vea afectada por problemas meteorológicos es pequeña. Para garantizar el menor número de cambios en la programación de un lanzamiento, los expertos en meteorología y aviación tienen en cuenta los cambios climáticos, los patrones meteorológicos y los datos existentes.
Puede empezar a explorar este problema por su cuenta si visita la programación de lanzamientos de la NASA. Incluso sin aprendizaje automático, eche un vistazo a los patrones meteorológicos previstos en Cabo Cañaveral. Trate de identificar por qué se eligieron una fecha y hora determinadas en vez de otras una semana antes o después.
Búsqueda de datos adicionales
El objetivo de esta ruta de aprendizaje es que emprenda un curioso recorrido por el tiempo y su relación con los lanzamientos de cohetes. Le recomendamos que descubra más datos para mejorar un modelo de Machine Learning propio. Es parte del recorrido por la ciencia de datos.
¿Qué cree que podría usar para detectar lanzamientos que han tenido que retrasarse debido al tiempo? ¿Artículos de noticias? ¿Archivos?