Descubrimiento de nuevos modelos de regresión

Completado

En la unidad 2, hemos visto cómo ajustar una línea recta a los puntos de datos. Sin embargo, la regresión puede ajustarse a muchos tipos de relaciones, incluidas aquellas con varios factores y aquellas en las que la importancia de un factor depende de otro.

Experimentación con modelos

A menudo se eligen los modelos de regresión porque funcionan con muestras de datos pequeñas, son sólidos, fáciles de interpretar y existe una gran variedad.

La regresión lineal es la forma más simple de regresión, sin límite en cuanto al número de características usadas. La regresión lineal se presenta de diversas formas y, a menudo, se las denomina en función del número de características usadas y la forma de la curva que mejor se ajusta.

Los árboles de decisión adoptan un enfoque paso a paso para predecir una variable. Si pensamos en el ejemplo de las bicicletas, el árbol de decisión puede dividir primero los ejemplos entre los que son durante primavera y verano y otoño e invierno, para hacer una predicción basada en el día de la semana. El lunes de primavera y verano puede tener una tasa de alquiler de bicicletas de 100 al día, mientras que el lunes de otoño e invierno puede tener una tasa de alquiler de 20 al día.

Los algoritmos de conjunto construyen no solo un árbol de decisión, sino un gran número de árboles, lo que permite realizar mejores predicciones sobre datos más complejos. Los algoritmos de conjunto, como bosque aleatorio, se usan ampliamente en el aprendizaje automático y en la ciencia de datos debido a sus sólidas capacidades de predicción.

Los científicos de datos suelen experimentar con el uso de modelos diferentes. En el ejercicio siguiente, experimentaremos con diferentes tipos de modelos para comparar su rendimiento con los mismos datos.