Compartir a través de


Creación de una ejecución de entrenamiento mediante la interfaz de usuario de optimización de foundation Model

Importante

Esta característica se encuentra en versión preliminar pública en las siguientes regiones: centralus, eastus, eastus2, northcentralus y westus.

En este artículo se describe cómo crear y configurar una ejecución de entrenamiento mediante la interfaz de usuario de optimización de modelos de Foundation Model (ahora parte de Mosaic AI Model Training). También puede crear una ejecución mediante la API. Para obtener instrucciones, consulte Creación de una ejecución de entrenamiento mediante foundation Model Fine-tuning API.

Requisitos

Vea Requisitos.

Creación de una ejecución de entrenamiento mediante la interfaz de usuario

Siga estos pasos para crear una ejecución de entrenamiento mediante la interfaz de usuario.

  1. En la barra lateral izquierda, haga clic en Experimentos.

  2. En la tarjeta Foundation Model Fine-tuning ,haga clic en Create Mosaic AI Model Experiment (Crear experimento de modelo de IA de mosaico).

    Formulario del experimento de modelo fundacional

  3. Se abre el formulario De ajuste fino de Foundation Model. Todos los elementos marcados con un asterisco son obligatorios. Realice sus selecciones y, después, haga clic en Iniciar entrenamiento.

    Tipo: seleccione la tarea que quiera que se realice.

    Tarea Descripción
    Ajuste de instrucciones Continúe entrenando un modelo fundacional mediante la entrada de solicitudes y respuestas para optimizar el modelo para una tarea específica.
    Entrenamiento previo continuo Continúe entrenando un modelo fundacional para proporcionarle conocimientos específicos de un dominio.
    Finalización del chat Continúe entrenando un modelo fundacional con registros de chat para optimizarlo para aplicaciones de preguntas y respuestas o de conversaciones.

    Seleccione el modelo de Foundation: seleccione el modelo que se va a ajustar o entrenar. Para obtener una lista de los modelos admitidos, consulte Modelos admitidos.

    Datos de entrenamiento: haga clic en Examinar para seleccionar una tabla en Unity Catalog o escriba la dirección URL completa de un conjunto de datos de Hugging Face. Para obtener recomendaciones de tamaño de datos, consulte Tamaño de datos recomendado para entrenamiento de modelos.

    Si selecciona una tabla en Unity Catalog, también debe seleccionar el proceso que se usará para leerla.

    Registrar en una ubicación: seleccione el catálogo y el esquema de Unity Catalog en los menús desplegables. El modelo entrenado se guarda en esta ubicación.

    Nombre del modelo: el modelo se guarda con este nombre en el catálogo y el esquema especificados. En ese campo aparece un nombre predeterminado, que puede cambiar si lo prefiere.

    Opciones avanzadas: para una mayor personalización, puede configurar valores opcionales para la evaluación, el ajuste de hiperparámetros o el entrenamiento a partir de un modelo existente de su propiedad.

    Configuración Descripción
    Duración del entrenamiento La duración de la ejecución de entrenamiento, especificada en épocas (por ejemplo, 10ep) o tokens (por ejemplo, 1000000tok). El valor predeterminado es 1ep.
    Velocidad de aprendizaje La velocidad de aprendizaje para el entrenamiento del modelo. El valor predeterminado es 5e-7. El optimizador es DecoupledLionW con betas de 0,99 y 0,95 y sin disminución de peso. El programador de velocidad de aprendizaje es LinearWithWarmupSchedule con un calentamiento del 2 % de la duración total del entrenamiento y un multiplicador de velocidad de aprendizaje final de 0.
    Longitud del contexto La longitud máxima de secuencia de un ejemplo de datos. Los datos más largos que esta configuración se truncan. La longitud predeterminada depende del modelo seleccionado.
    Datos de evaluación Haga clic en Examinar para seleccionar una tabla en Unity Catalog o escriba la dirección URL completa de un conjunto de datos de Hugging Face. Si deja este campo en blanco, no se realiza ninguna evaluación.
    Instrucciones de evaluación del modelo Escriba instrucciones opcionales que se usarán para evaluar el modelo.
    Nombre del experimento De forma predeterminada, se asigna un nuevo nombre generado automáticamente para cada ejecución. Opcionalmente, puede escribir un nombre personalizado o seleccionar un experimento existente en la lista desplegable.
    Pesos personalizados De forma predeterminada, el entrenamiento comienza usando los pesos originales del modelo seleccionado. Para empezar a usar pesos personalizados desde un punto de control de Composer, escriba la ruta de acceso a la tabla de Unity Catalog que contiene los valores de punto de control.

Pasos siguientes

Una vez completada la ejecución de entrenamiento, puede revisar las métricas en MLflow e implementar el modelo para la inferencia. Consulte los pasos del 5 al 7 del Tutorial: Creación e implementación de una ejecución de ajuste fino de Foundation Model.

Consulte el cuaderno de demostración Optimización de instrucciones: Reconocimiento de entidades con nombre para ver un ejemplo de optimización de instrucciones que recorre la preparación de los datos, la configuración de la ejecución del entrenamiento de optimización y la implementación.