Compartilhar via


Registro automático no Microsoft Fabric

A Ciência de Dados do Synapse no Microsoft Fabric inclui o registro automático, o que reduz significativamente a quantidade de código necessária para registrar automaticamente os parâmetros, as métricas e os itens de um modelo de machine learning durante o treinamento. Este artigo descreve o registro automático para a Ciência de Dados do Synapse no Microsoft Fabric.

O registro automático estende funcionalidades de Acompanhamento do MLflow e é profundamente integrado à experiência de Ciência de Dados do Synapse no Microsoft Fabric. O registro automático pode capturar várias métricas, incluindo precisão, perda, pontuação F1 e métricas personalizadas que você definir. Usando o registro automático, desenvolvedores e cientistas de dados podem acompanhar e comparar facilmente o desempenho de diferentes modelos e experimentos sem acompanhamento manual.

Estruturas com suporte

O registro automático dá suporte a uma ampla gama de estruturas de aprendizado de máquina, incluindo TensorFlow, PyTorch, Scikit-learn e XGBoost. Para saber mais sobre as propriedades específicas da estrutura que o registro automático captura, consulte a documentação do MLflow.

Configuração

O registro automático funciona capturando automaticamente valores de parâmetros de entrada, métricas de saída e itens de saída de um modelo de machine learning enquanto ele está sendo treinado. Essas informações são registradas no workspace do Microsoft Fabric, onde você pode acessá-los e visualizá-los usando as APIs do MLflow ou os itens de modelo e experimento correspondentes no workspace do Microsoft Fabric.

Quando você inicia um notebook de Ciência de Dados do Synapse, o Microsoft Fabric chama mlflow.autolog() para habilitar instantaneamente o acompanhamento e carregar as dependências correspondentes. Ao treinar modelos em seu notebook, o MLflow controla automaticamente essas informações do modelo.

A configuração ocorre automaticamente nos bastidores quando você executa import mlflow. A configuração padrão do notebook mlflow.autolog() hook é:


mlflow.autolog(
    log_input_examples=False,
    log_model_signatures=True,
    log_models=True,
    disable=False,
    exclusive=True,
    disable_for_unsupported_versions=True,
    silent=True
)

Personalização

Para personalizar o comportamento de registro, use a configuração mlflow.autolog(). Essa configuração fornece parâmetros para habilitar o registro em log do modelo, coletar exemplos de entrada, configurar avisos ou habilitar o registro em log para o conteúdo adicionado especificado.

Acompanhar mais métricas, parâmetros e propriedades

Para execuções criadas com o MLflow, atualize a configuração de registro automático do MLflow para acompanhar métricas, parâmetros, arquivos e metadados adicionais da seguinte maneira:

  1. Atualize a chamada mlflow.autolog() para definir exclusive=False.

        mlflow.autolog(
        log_input_examples=False,
        log_model_signatures=True,
        log_models=True,
        disable=False,
        exclusive=False, # Update this property to enable custom logging
        disable_for_unsupported_versions=True,
        silent=True
    )
    
  2. Use as APIs de acompanhamento do MLflow para registrar parâmetros e métricas adicionais. O código de exemplo a seguir permite registrar em log suas métricas e parâmetros personalizados junto com propriedades adicionais.

    import mlflow
    mlflow.autolog(exclusive=False)
    
    with mlflow.start_run():
      mlflow.log_param("parameter name", "example value")
      # <add model training code here>
      mlflow.log_metric("metric name", 20)
    

Desabilitar o registro automático do Microsoft Fabric

Você pode desabilitar o registro automático do Microsoft Fabric para uma sessão de notebook específica. Você também pode desabilitar o registro automático em todos os notebooks usando a configuração do workspace.

Nota

Se o registro automático estiver desabilitado, você deverá registrar manualmente seus parâmetros e métricas usando as APIs do MLflow.

Desabilitar o registro automático para uma sessão de notebook

Para desabilitar o registro automático do Microsoft Fabric para uma sessão de notebook específica, chame mlflow.autolog() e defina disable=True.

import mlflow
mlflow.autolog(disable=True)

Desabilitar o registro automático para todos os notebooks e sessões

Os administradores do workspace podem habilitar ou desabilitar o registro automático do Microsoft Fabric para todos os blocos de anotações e sessões em seu workspace usando as configurações do workspace. Para habilitar ou desabilitar o autolog da Synapse Data Science:

  1. Em seu workspace, selecione Configurações do workspace.

    Captura de tela do workspace com as configurações do Workspace realçadas.

  2. Em Configurações de workspace, expanda Engenharia/Ciência de Dados na barra de navegação esquerda e selecione Configurações de Spark.

  3. Em Configurações do Spark, selecione a guia Registro automático.

  4. Defina Acompanhar automaticamente experimentos e modelos de machine learning como Ativado ou Desativado.

  5. Selecione Salvar.

    Captura de tela da configuração do workspace para registro automático.