Usar parâmetros de pipeline para treinar novamente modelos no designer
Neste artigo de instruções, você saberá como usar o designer do Azure Machine Learning para treinar novamente um modelo de machine learning usando parâmetros de pipeline. Você usará pipelines publicados para automatizar seu fluxo de trabalho e definir parâmetros para treinar seu modelo para novos dados. Os parâmetros de pipeline permitem que você reutilize pipelines existentes para trabalhos diferentes.
Neste artigo, você aprenderá como:
- Treinar um modelo de machine learning.
- Crie um parâmetro de pipeline.
- Publique seu pipeline de treinamento.
- Readapte seu modelo com novos parâmetros.
Pré-requisitos
- Um Workspace do Azure Machine Learning
- Conclua a parte 1 desta série de instruções, Transformação de dados no designer
Importante
Se você não vir os elementos gráficos mencionados neste documento, como botões no estúdio ou no designer, talvez você não tenha o nível de permissões certo para o workspace. Entre em contato com seu administrador de assinatura do Azure para verificar se você recebeu o nível de acesso correto. Para obter mais informações, confira Gerenciar usuários e funções.
Este artigo também pressupõe que você tenha algum conhecimento sobre a criação de pipelines no designer. Para obter uma introdução guiada, conclua o tutorial.
Amostra do pipeline
O pipeline usado neste artigo é uma versão alterada de uma previsão de renda de pipeline de exemplo na página inicial do designer. O pipeline usa o componente Importar Dados, em vez de usar um conjunto de dados de exemplo para mostrar a você como treinar modelos usando seus próprios dados.
Criação de um parâmetro de pipeline
Os parâmetros de pipeline são usados para criar pipelines versáteis que podem ser reenviados mais tarde com valores de parâmetro variados. Alguns cenários comuns são a atualização de conjuntos de dados ou alguns hiperparâmetros para novo treinamento. Crie parâmetros de pipeline para definir variáveis dinamicamente em tempo de execução.
Os parâmetros de pipeline podem ser adicionados à fonte de dados ou parâmetros de componente em um pipeline. Quando o pipeline é reenviado, os valores desses parâmetros podem ser especificados.
Para este exemplo, você irá alterar o caminho de dados de treinamento de um valor fixo para um parâmetro, para que você possa readaptar seu modelo para dados diferentes. Você também pode adicionar outros parâmetros de componente como parâmetros de pipeline de acordo com seu caso de uso.
Selecione o componente Importar Dados.
Observação
Este exemplo usa o componente Importar Dados para acessar dados em um armazenamento de dados registrado. No entanto, você pode seguir etapas semelhantes se usar padrões de acesso a dados alternativos.
No painel de detalhes do componente à direita da tela, selecione a sua fonte de dados.
Digite o caminho para os seus dados. Você também pode selecionar Procurar caminho para procurar em sua árvore de arquivos.
Passe com o cursor do mouse sobre o campo Caminho e selecione as reticências exibidas acima do campo Caminho.
Selecione Adicionar ao parâmetro de pipeline.
Forneça um nome de parâmetro e um valor padrão.
Selecione Salvar.
Observação
Você também pode desanexar um parâmetro de componente do parâmetro de pipeline no painel de detalhes do componente, semelhante à adição de parâmetros de pipeline.
Você pode inspecionar e editar seus parâmetros de pipeline selecionando o ícone de engrenagem de Configurações ao lado do título do seu rascunho de pipeline.
- Depois de desanexar, você pode excluir o parâmetro de pipeline no painel Configurações.
- Você também pode adicionar um parâmetro de pipeline no painel Configurações e aplicá-lo em algum parâmetro de componente.
Envie o trabalho de pipeline.
Publicação de um pipeline de treinamento
Publique um pipeline em um ponto de extremidade de pipeline para reutilizar facilmente seus pipelines no futuro. Um ponto de extremidade de pipeline cria um ponto de extremidade REST para invocar o pipeline no futuro. Neste exemplo, o ponto de extremidade do pipeline permite reutilizar o pipeline para readaptar um modelo para dados diferentes.
Selecione Publicar acima da tela do designer.
Selecione ou crie um ponto de extremidade de pipeline.
Observação
Você pode publicar vários pipelines em um único ponto de extremidade. Cada pipeline em um determinado ponto de extremidade recebe um número de versão, que você pode especificar quando chama o ponto de extremidade do pipeline.
Selecione Publicar.
Readaptação do modelo
Agora que você publicou um pipeline de treinamento, use-o para readaptar seu modelo para novos dados. Você pode enviar trabalhos de um ponto de extremidade de pipeline do workspace do estúdio ou programaticamente.
Enviar trabalhos usando o portal do estúdio
Siga as etapas adiante para enviar um trabalho de ponto de extremidade de pipeline com parâmetros a partir do portal do estúdio:
- Acesse a página Pontos de extremidade no workspace do estúdio.
- Selecione a guia Pontos de extremidade de pipeline. Em seguida, selecione o ponto de extremidade do pipeline.
- Selecione a guia Pipelines publicados. Em seguida, selecione a versão do pipeline que você deseja executar.
- Selecione Enviar.
- Na caixa de diálogo de configuração, especifique os valores dos parâmetros para o trabalho. Para este exemplo, atualize o caminho de dados para treinar seu modelo usando um conjunto de dados que não seja dos EUA.
Enviar trabalhos usando código
Encontre o ponto de extremidade de REST de um pipeline publicado no painel de visão geral. É possível readaptar o pipeline publicado chamando o ponto de extremidade.
Para realizar uma chamada REST, você precisa de um cabeçalho de autenticação do tipo portador do OAuth 2.0. Para mais informações sobre como configurar a autenticação do seu workspace e fazer uma chamada REST com parâmetros, veja Usar o REST para gerenciar recursos.
Próximas etapas
Neste artigo, você aprendeu a criar um ponto de extremidade de pipeline de treinamento com parâmetros usando o designer.
Para obter uma explicação completa de como você pode implantar um modelo para fazer previsões, veja o tutorial do designer para treinar e implantar um modelo de regressão.
Para saber como publicar e enviar um trabalho de ponto de extremidade de pipeline usando o SDK v1, confira o artigo Publicar pipelines.