¿Qué son los modelos de aprendizaje automático?
El modelo es el componente principal del aprendizaje automático y en última instancia, lo que intentamos compilar. Un modelo podría calcular la edad de una persona a partir de una foto, predecir lo que le gustaría ver en las redes sociales o decidir dónde se debe mover un brazo robótico. En nuestro escenario, queremos crear un modelo que pueda calcular la talla de botas más adecuada para un perro en función de la talla de su arnés.
Los modelos se pueden crear de muchas maneras. Por ejemplo, son las personas las que crean un modelo tradicional que simula el vuelo de un avión, con conocimientos de física e ingeniería. Los modelos de aprendizaje automático son especiales, ya que en lugar de editarlos las personas para que sean eficaces, son los datos los que les dan forma. Aprenden de la experiencia.
Planteamientos sobre los modelos
Un modelo puede plantearse como una función que acepta datos como entrada y genera una salida. En concreto, un modelo usa los datos de entrada para calcular otra cosa. Por ejemplo, en nuestro escenario, queremos compilar un modelo que tenga un tamaño de arnés y calcule el tamaño de arranque:
Tenga en cuenta que tanto la talla del arnés como la de las botas para perros son datos, no forman parte del modelo. La talla del arnés es la entrada y la talla de las botas para perros es la salida.
Los modelos suelen ser código sencillo
Los modelos a menudo no son significativamente diferentes de las funciones sencillas con las que ya está familiarizado. Al igual que otro código, contienen lógica y parámetros. Por ejemplo, la lógica podría ser multiplicar el tamaño del arnés por parameter_1:
Si parameter_1 aquí fuese 2,5, nuestro modelo multiplicaría la talla del arnés por 2,5 y devolvería el resultado siguiente:
Selección de un modelo
Hay muchos tipos de modelo, algunos de ellos sencillos y otros complejos.
Al igual que sucede con cualquier código, los modelos más sencillos suelen ser los más fiables y fáciles de entender, mientras que los modelos complejos pueden llevar a cabo grandes hazañas. El tipo de modelo que debería elegir depende de su objetivo. Por ejemplo, los científicos médicos suelen trabajar con modelos relativamente sencillos porque son fiables e intuitivos. Por el contrario, los robots basados en inteligencia artificial suelen depender de modelos complejos.
El primer paso del aprendizaje automático es seleccionar el tipo de modelo que querría usar. Por tanto, el modelo se elige en función de su lógica interna. Por ejemplo, podríamos seleccionar un modelo de dos parámetros para calcular la talla de las botas para perros a partir de la talla del arnés:
Observe cómo hemos seleccionado un modelo en función de cómo funciona lógicamente, pero no en función de sus valores de parámetro. De hecho, en este momento los parámetros no se han establecido en ningún valor concreto.
Detección de los parámetros durante el entrenamiento
El diseñador humano no selecciona los valores de parámetro. En lugar de esto, se define una estimación inicial de los valores de parámetro y, después, dichos valores de parámetro se ajustan durante un proceso de aprendizaje automatizado denominado entrenamiento.
Dada la selección de un modelo de dos parámetros, primero se proporcionan estimaciones aleatorias para los parámetros:
Estos parámetros aleatorios significan que el modelo no es eficaz a la hora de calcular la talla de las botas, por lo que se lleva a cabo el entrenamiento. Durante el entrenamiento, estos parámetros son sustituidos de forma automática por dos nuevos valores que proporcionan mejores resultados:
El funcionamiento exacto de este proceso es algo que se explica de forma progresiva a lo largo del recorrido de aprendizaje.