Registros do Machine Learning para MLOps
Este artigo descreve como os registros do Azure Machine Learning separam ativos de machine learning de workspaces, permitindo que você use MLOps em ambientes de desenvolvimento, teste e produção. Seus ambientes podem variar de acordo com a complexidade dos seus sistemas de TI. Os seguintes fatores influenciam o número e o tipo de ambientes de que você precisa:
- Políticas de segurança e conformidade. Os ambientes de produção podem precisar ser isolados de ambientes de desenvolvimento em termos de controles de acesso, arquitetura de rede e exposição de dados.
- Assinaturas. Ambientes de desenvolvimento e de produção geralmente usam assinaturas separadas para fins de cobrança, orçamento e gerenciamento de custos.
- Regiões. Você pode precisar implantar em diferentes regiões do Azure para dar suporte a requisitos de latência e redundância.
Nos cenários anteriores, você pode usar diferentes workspaces do Azure Machine Learning para desenvolvimento, teste e produção. Essa configuração apresenta os seguintes desafios potenciais para treinamento e implantação de modelo:
Você pode precisar treinar um modelo em um workspace de desenvolvimento, mas implantá-lo em um ponto de extremidade em um workspace de produção, possivelmente em uma assinatura ou região diferente do Azure. Nesse caso, você deve rastrear o trabalho de treinamento. Por exemplo, se você encontrar problemas de precisão ou desempenho na implantação de produção, precisará analisar as métricas, logs, códigos, ambientes e dados usados para treinar o modelo.
Você pode precisar desenvolver um pipeline de treinamento com dados de teste ou anonimizados no workspace de desenvolvimento, mas treinar novamente o modelo com dados de produção no workspace de produção. Nesse caso, talvez seja necessário comparar as métricas de treinamento em dados de exemplo com os dados de produção, para verificar se as otimizações de treinamento estão funcionando corretamente com os dados reais.
MLOps entre workspaces com registros
Um registro, assim como um repositório Git, separa os ativos de machine learning dos workspaces e os hospeda em uma localização central, disponibilizando-os para todos os workspaces em sua organização. Você pode usar registros para armazenar e compartilhar ativos, como modelos, ambientes, componentes e conjuntos de dados.
Para promover modelos em ambientes de desenvolvimento, teste e produção, você pode começar desenvolvendo iterativamente um modelo no ambiente de desenvolvimento. Quando você tem um bom modelo de candidato, pode publicá-lo em um registro. Em seguida, você pode implantar o modelo do Registro em pontos de extremidade em diferentes workspaces.
Dica
Se você já tiver modelos registrados em um workspace, poderá promovê-los para um registro. Você também pode registrar um modelo diretamente em um registro da saída de um trabalho de treinamento.
Para desenvolver um pipeline em um workspace e executá-lo em outros, comece registrando os componentes e ambientes que formam os blocos de construção do pipeline. Quando você envia o trabalho de pipeline, os dados de computação e de treinamento, que são exclusivos para cada workspace, determine o workspace em que ocorrerá a execução.
O diagrama a seguir mostra a promoção do pipeline de treinamento entre workspaces exploratórios e de desenvolvimento e, em seguida, a promoção de modelo treinado para teste e produção.