Configurar o MLflow para rastreamento de modelos em blocos de anotações

Concluído

Como cientista de dados, você vai querer desenvolver um modelo em um bloco de anotações, pois ele permite que você teste e execute código rapidamente.

Sempre que você treina um modelo, você quer que os resultados sejam reproduzíveis. Ao acompanhar e registrar seu trabalho, você pode revisá-lo a qualquer momento e decidir qual é a melhor abordagem para treinar um modelo.

MLflow é uma biblioteca de código aberto para rastrear e gerenciar seus experimentos de aprendizado de máquina. Em particular, o MLflow Tracking é um componente do MLflow que registra tudo sobre o modelo que você está treinando, como parâmetros, métricas e artefatos.

Para usar o MLflow em blocos de anotações no espaço de trabalho do Azure Machine Learning, você precisará instalar as bibliotecas necessárias e definir o Azure Machine Learning como o repositório de rastreamento. Depois de configurar o MLflow, você pode começar a usar o MLflow ao treinar modelos em notebooks.

Configurar o MLflow em blocos de anotações

Você pode criar e editar blocos de anotações no Aprendizado de Máquina do Azure ou em um dispositivo local.

Usar blocos de anotações do Azure Machine Learning

No espaço de trabalho do Azure Machine Learning, você pode criar blocos de anotações e conectá-los a uma instância de computação gerenciada do Azure Machine Learning.

Quando você está executando um bloco de anotações em uma instância de computação, o MLflow já está configurado e pronto para ser usado.

Para verificar se os pacotes necessários estão instalados, você pode executar o seguinte código:

pip show mlflow
pip show azureml-mlflow

O mlflow pacote é a biblioteca de código aberto. O azureml-mlflow pacote contém o código de integração do Azure Machine Learning com MLflow.

Usar MLflow em um dispositivo local

Quando preferir trabalhar em blocos de notas num dispositivo local, também pode utilizar o MLflow. Você precisará configurar o MLflow concluindo as seguintes etapas:

  1. Instale o e azureml-mlflow pacotemlflow.

    pip install mlflow
    pip install azureml-mlflow
    
  2. Navegue até o estúdio do Azure Machine Learning.

  3. Selecione o nome do espaço de trabalho em que está a trabalhar no canto superior direito do estúdio.

  4. Selecione Exibir todas as propriedades no portal do Azure. Uma nova guia será aberta para levá-lo ao serviço Azure Machine Learning no portal do Azure.

  5. Copie o valor do URI de rastreamento MLflow.

Screenshot of overview page in Azure portal showing the MLflow tracking URI.

  1. Use o código a seguir em seu bloco de anotações local para configurar o MLflow para apontar para o espaço de trabalho do Azure Machine Learning e defina-o para o URI de controle do espaço de trabalho.

    mlflow.set_tracking_uri = "MLFLOW-TRACKING-URI"
    

Gorjeta

Saiba mais sobre abordagens alternativas para configurar o ambiente de rastreamento ao trabalhar em um dispositivo local. Por exemplo, você também pode usar o SDK do Azure Machine Learning v2 para Python, juntamente com o arquivo de configuração do espaço de trabalho, para definir o URI de rastreamento.

Depois de configurar o MLflow para acompanhar os resultados do seu modelo e armazená-lo em seu espaço de trabalho do Azure Machine Learning, você estará pronto para experimentar em um bloco de anotações.