Compartir vía


Registro automático en Microsoft Fabric

Ciencia de datos de Synapse en Microsoft Fabric incluye el registro automático, lo que reduce significativamente la cantidad de código necesario para registrar automáticamente los parámetros, las métricas y los elementos de un modelo de aprendizaje automático durante el entrenamiento. En este artículo se describe el registro automático de la Ciencia de datos de Synapse en Microsoft Fabric.

El registro automático amplía las funcionalidades de Seguimiento de MLflow y está profundamente integrado en la Ciencia de datos de Synapse en la experiencia de Microsoft Fabric. El registro automático es capaz de capturar diferentes métricas, incluidas la precisión, la pérdida y la puntuación F1, así como las métricas personalizadas que usted defina. Al utilizar el registro automático, los desarrolladores y científicos de datos pueden realizar un seguimiento y comparar fácilmente el rendimiento de diferentes modelos y experimentos sin necesidad de realizar seguimientos manuales.

Marcos de trabajo admitidos

El registro automático admite una amplia gama de marcos de aprendizaje automático, como TensorFlow, PyTorch, Scikit-learn y XGBoost. Para obtener más información sobre las propiedades específicas del marco que se capturan mediante el registro automático, consulte la documentación de MLflow.

Configuración

El registro automático funciona capturando automáticamente los valores de los parámetros de entrada, las métricas de salida y los elementos de salida de un modelo de Machine Learning a medida que se entrene. Esta información se registrará en el área de trabajo de Microsoft Fabric, donde se puede acceder a ella y visualizarla mediante las API de MLflow o los elementos del modelo y del experimento correspondientes en el área de trabajo de Microsoft Fabric.

Al iniciar un cuaderno de Ciencia de datos de Synapse, Microsoft Fabric llamará a mlflow.autolog() para habilitar al instante el seguimiento y cargar las dependencias correspondientes. A medida que entrene modelos en el cuaderno, MLflow realizará un seguimiento automático de esta información del modelo.

La configuración se realiza automáticamente en segundo plano al ejecutar import mlflow. La configuración predeterminada para el enlace mlflow.autolog() de cuaderno es:


mlflow.autolog(
    log_input_examples=False,
    log_model_signatures=True,
    log_models=True,
    disable=False,
    exclusive=True,
    disable_for_unsupported_versions=True,
    silent=True
)

Personalización

Para personalizar el comportamiento de registro, use la configuración mlflow.autolog(). Esta configuración proporciona los parámetros para habilitar el registro de modelos, recopilar ejemplos de entrada, configurar advertencias o habilitar el registro para el contenido agregado que especifique.

Seguimiento de más métricas, parámetros y propiedades

En las ejecuciones creadas con MLflow, actualice la configuración de registro automático de MLflow para realizar un seguimiento de métricas, parámetros, archivos y metadatos adicionales de la siguiente manera:

  1. Actualice la llamada mlflow.autolog() y establezca exclusive=False.

        mlflow.autolog(
        log_input_examples=False,
        log_model_signatures=True,
        log_models=True,
        disable=False,
        exclusive=False, # Update this property to enable custom logging
        disable_for_unsupported_versions=True,
        silent=True
    )
    
  2. Use las API de seguimiento de MLflow para registrar parámetros y métricas adicionales. El código de ejemplo siguiente permite registrar las métricas y los parámetros personalizados junto con propiedades adicionales.

    import mlflow
    mlflow.autolog(exclusive=False)
    
    with mlflow.start_run():
      mlflow.log_param("parameter name", "example value")
      # <add model training code here>
      mlflow.log_metric("metric name", 20)
    

Deshabilitación del registro automático de Microsoft Fabric

Puede deshabilitar el registro automático de Microsoft Fabric en una sesión de cuaderno específica. También puede deshabilitar el registro automático en todos los cuadernos mediante la configuración del área de trabajo.

Nota:

Si el registro automático estuviera deshabilitado, deberá registrar manualmente sus propios parámetros y métricas mediante las API de MLflow.

Deshabilitación del registro automático en una sesión de cuaderno

Para deshabilitar el registro automático de Microsoft Fabric en una sesión de cuaderno específica, realice una llamada a mlflow.autolog() y establezca disable=True.

import mlflow
mlflow.autolog(disable=True)

Deshabilitación del registro automático en todos los cuadernos y sesiones.

Los administradores del área de trabajo pueden habilitar o deshabilitar el registro automático de Microsoft Fabric para todos los cuadernos y las sesiones mediante la configuración del área de trabajo. Para habilitar o deshabilitar el registro automático de Ciencia de datos de Synapse:

  1. En su área de trabajo de Ciencia de datos de Synapse, seleccione Configuración del área de trabajo.

    Captura de pantalla de la página Ciencia de datos de Synapse con la configuración del área de trabajo resaltada.

  2. En la pantalla Configuración del área de trabajo, expanda Ingeniería/Ciencia de datos en la barra de navegación izquierda y seleccione Configuración de Spark.

  3. En la pantalla Configuración de Spark, seleccione la pestaña Registro automático.

  4. Establezca Seguimiento automático de experimentos y modelos de aprendizaje automático en Activado o Desactivado.

  5. Seleccione Guardar.

    Captura de pantalla de la configuración del área de trabajo de Ciencia de datos para el registro automático.