Registro automático no Microsoft Fabric
A Ciência de Dados do Synapse no Microsoft Fabric inclui o registro automático, o que reduz significativamente a quantidade de código necessária para registrar automaticamente os parâmetros, as métricas e os itens de um modelo de machine learning durante o treinamento. Este artigo descreve o registro automático para a Ciência de Dados do Synapse no Microsoft Fabric.
O registro automático estende funcionalidades de Acompanhamento do MLflow e é profundamente integrado à experiência de Ciência de Dados do Synapse no Microsoft Fabric. O registro automático pode capturar várias métricas, incluindo precisão, perda, pontuação F1 e métricas personalizadas que você definir. Usando o registro automático, desenvolvedores e cientistas de dados podem acompanhar e comparar facilmente o desempenho de diferentes modelos e experimentos sem acompanhamento manual.
Estruturas com suporte
O registro automático dá suporte a uma ampla gama de estruturas de aprendizado de máquina, incluindo TensorFlow, PyTorch, Scikit-learn e XGBoost. Para saber mais sobre as propriedades específicas da estrutura que o registro automático captura, consulte a documentação do MLflow.
Configuração
O registro automático funciona capturando automaticamente valores de parâmetros de entrada, métricas de saída e itens de saída de um modelo de machine learning enquanto ele está sendo treinado. Essas informações são registradas no workspace do Microsoft Fabric, onde você pode acessá-los e visualizá-los usando as APIs do MLflow ou os itens de modelo e experimento correspondentes no workspace do Microsoft Fabric.
Quando você inicia um notebook de Ciência de Dados do Synapse, o Microsoft Fabric chama mlflow.autolog() para habilitar instantaneamente o acompanhamento e carregar as dependências correspondentes. Ao treinar modelos em seu notebook, o MLflow controla automaticamente essas informações do modelo.
A configuração ocorre automaticamente nos bastidores quando você executa import mlflow
. A configuração padrão do notebook mlflow.autolog() hook é:
mlflow.autolog(
log_input_examples=False,
log_model_signatures=True,
log_models=True,
disable=False,
exclusive=True,
disable_for_unsupported_versions=True,
silent=True
)
Personalização
Para personalizar o comportamento de registro, use a configuração mlflow.autolog(). Essa configuração fornece parâmetros para habilitar o registro em log do modelo, coletar exemplos de entrada, configurar avisos ou habilitar o registro em log para o conteúdo adicionado especificado.
Acompanhar mais métricas, parâmetros e propriedades
Para execuções criadas com o MLflow, atualize a configuração de registro automático do MLflow para acompanhar métricas, parâmetros, arquivos e metadados adicionais da seguinte maneira:
Atualize a chamada mlflow.autolog() para definir
exclusive=False
.mlflow.autolog( log_input_examples=False, log_model_signatures=True, log_models=True, disable=False, exclusive=False, # Update this property to enable custom logging disable_for_unsupported_versions=True, silent=True )
Use as APIs de acompanhamento do MLflow para registrar parâmetros e métricas adicionais. O código de exemplo a seguir permite registrar em log suas métricas e parâmetros personalizados junto com propriedades adicionais.
import mlflow mlflow.autolog(exclusive=False) with mlflow.start_run(): mlflow.log_param("parameter name", "example value") # <add model training code here> mlflow.log_metric("metric name", 20)
Desabilitar o registro automático do Microsoft Fabric
Você pode desabilitar o registro automático do Microsoft Fabric para uma sessão de notebook específica. Você também pode desabilitar o registro automático em todos os notebooks usando a configuração do workspace.
Nota
Se o registro automático estiver desabilitado, você deverá registrar manualmente seus parâmetros e métricas usando as APIs do MLflow.
Desabilitar o registro automático para uma sessão de notebook
Para desabilitar o registro automático do Microsoft Fabric para uma sessão de notebook específica, chame mlflow.autolog() e defina disable=True
.
import mlflow
mlflow.autolog(disable=True)
Desabilitar o registro automático para todos os notebooks e sessões
Os administradores do workspace podem habilitar ou desabilitar o registro automático do Microsoft Fabric para todos os blocos de anotações e sessões em seu workspace usando as configurações do workspace. Para habilitar ou desabilitar o autolog da Synapse Data Science:
Em seu workspace, selecione Configurações do workspace.
Em Configurações de workspace, expanda Engenharia/Ciência de Dados na barra de navegação esquerda e selecione Configurações de Spark.
Em Configurações do Spark, selecione a guia Registro automático.
Defina Acompanhar automaticamente experimentos e modelos de machine learning como Ativado ou Desativado.
Selecione Salvar.