Cuándo ajustar un modelo base

Completado

El uso de modelos base de código abierto previamente entrenados le permite ahorrar recursos. Es posible que algunas veces tenga que ajustar un modelo base para satisfacer sus necesidades específicas.

Exploración de los modelos base del catálogo de modelos

Los modelos base son modelos de aprendizaje automático de gran tamaño que ya están entrenados para servir como base para una amplia variedad de casos de uso.

En Azure Machine Learning, puede explorar los modelos base de código abierto haciendo búsquedas en el catálogo de modelos. El tipo de modelo base que necesita depende de para qué desea usar el modelo.

En general, los modelos base se entrenan con grandes cantidades de datos y destacan en la realización de tareas genéricas como el reconocimiento del lenguaje, la generación de texto y la predicción del contexto. Sin embargo, es posible que no sean la mejor opción si necesita un modelo adaptado a una tarea o un dominio específicos. En estos casos, ajustar un modelo base con datos específicos de una tarea puede ayudar a satisfacer sus requisitos específicos y lograr mejores resultados.

Ajuste de modelos base para tareas específicas

Aunque es posible que los modelos base ya satisfagan sus requisitos, puede que sea necesario ajustar un modelo base.

Los modelos base se han entrenado previamente con una amplia gama de texto de Internet, lo que los convierte en expertos en el reconocimiento del lenguaje general. Sin embargo, el ajuste le permite adaptar el conocimiento del modelo a una tarea o un dominio específicos, de modo que optimiza el rendimiento y se asegura de que destaca en ese contexto concreto.

Las siguientes son algunas tareas comunes para las que puede querer ajustar un modelo base:

  • Clasificación de texto: clasificar un texto determinado en clases o categorías predefinidas en función de su contenido o contexto.
  • Clasificación de tokens: asignar etiquetas específicas a tokens o palabras individuales en un texto, que a menudo se usan en tareas como el reconocimiento de entidades con nombre.
  • Respuesta a preguntas: proporcionar respuestas precisas y relevantes a preguntas formuladas en lenguaje natural.
  • Resumen: crear resúmenes concisos y coherentes de textos más largos, capturando la información esencial.
  • Traducción: convertir texto de un idioma a otro conservando el significado y el contexto.

Dado que los modelos base ya están entrenados, necesita un conjunto de datos específico de la tarea más pequeño para ajustar un modelo base. Al ajustar un modelo, es probable que necesite menos datos y capacidad de proceso que si tuviera que entrenar un modelo desde cero.

Puede ajustar un modelo base del catálogo de modelos de Azure Machine Learning. Solo necesita un conjunto de datos reducido y un clúster de GPU para ajustar un modelo.