Resumen
Hemos completado nuestra introducción a la clasificación, por lo que vamos a resumir algunos puntos clave.
Hemos visto que la clasificación tiene mucho en común con la regresión clásica. En ambos modelos se puede usar el aprendizaje supervisado, una función de costo, y usar conjuntos de datos de prueba y entrenamiento para estimar el rendimiento real. Aquí nos centramos en la regresión logística, que es casi un modelo híbrido entre los dos tipos indicados, y mostramos cómo establecer un umbral de salida nos proporciona una etiqueta categórica, como avalanche
/no-avalanche
.
Hemos analizado cómo evaluar los modelos de clasificación puede ser ligeramente más difícil que los modelos de regresión, especialmente porque las funciones de costos implicadas a menudo no son intuitivas.
También hemos explorado cómo agregar y combinar características podría dar lugar a mejoras sustanciales en el modelo. Lo importante es que hemos mostrado cómo pensar realmente en lo que significan los datos es la clave para lograr el mejor resultado.
En este módulo, hemos trabajado con la regresión logística. Pero tenga en cuenta que la mayoría de los temas que tratamos aquí se aplican también a muchos otros tipos de modelos de clasificación. Incluidos los modelos que intentan predecir más de dos categorías posibles.