Introducción

Completado

La forma en que entrenamos los modelos no es, en ningún caso, un proceso totalmente automatizado. Confiar ciegamente en el entrenamiento de los datos puede llevarlos a aprender cosas que no terminen resultando útiles o a no aprender cosas de forma efectiva que realmente sean útiles. En el siguiente material didáctico se exponen algunas razones sencillas por las que se producen el sobreajuste o el ajuste deficiente, y lo que se puede hacer al respecto.

Escenario: entrenamiento de perros de rescate en avalanchas

A lo largo de este módulo, usaremos el siguiente escenario de ejemplo para explicar el ajuste deficiente y el sobreajuste. Este escenario está diseñado para proporcionarle un ejemplo de cómo podría abordar estos conceptos cuando programa. Tenga en cuenta que estos principios suelen aplicarse a casi todos los tipos de modelos y no solo a los que trabajamos aquí.

Ha llegado el momento de entrenar a una nueva generación de perros en la búsqueda de excursionistas que han sido arrastrados por avalanchas. Existe un debate en la oficina sobre qué perros son los mejores: ¿es mejor un perro grande que un perro más pequeño? ¿Los perros se deben entrenar cuando sean pequeños o cuando sean más mayores? Afortunadamente, cuenta con estadísticas sobre los rescates realizados en los últimos años que puede consultar. Sin embargo, el entrenamiento de perros resulta caro: debe asegurarse de que los criterios de selección de perros sean seguros.

Requisitos previos

  • Familiaridad con los modelos de Machine Learning

Objetivos de aprendizaje

Objetivos de este módulo:

  • Definir la normalización de características.
  • Crear y trabajar con conjuntos de datos de prueba.
  • Articular cómo los modelos de prueba pueden mejorar y dañar el entrenamiento.