Explorar e usar ambientes coletados
Ambientes coletados são ambientes predefinidos para as cargas de trabalho de aprendizado de máquina mais comuns, disponíveis em seu workspace por padrão.
Os ambientes coletados usam o prefixo AzureML - e são projetados para fornecer scripts que usam estruturas e ferramentas populares de aprendizado de máquina.
Por exemplo, há ambientes coletados para quando você deseja executar um script que treina um modelo de regressão, clustering ou classificação com o Scikit-Learn.
Para explorar um ambiente coletado, você poderá exibir no estúdio usando a CLI do Azure ou o SDK do Python.
O comando a seguir permite recuperar a descrição e as tags de um ambiente coletado com o SDK do Python:
env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)
Usar o ambiente coletado
Normalmente, você usa ambientes quando deseja executar um script como um trabalho (comando).
Para especificar qual ambiente você deseja usar para executar o script, faça referência a um ambiente por seu nome e versão.
Por exemplo, o código a seguir mostra como configurar um trabalho de comando com o SDK do Python, que usa um ambiente coletado, incluindo o Scikit-Learn:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
display_name="train-with-curated-environment",
experiment_name="train-with-curated-environment"
)
# submit job
returned_job = ml_client.create_or_update(job)
Testar e solucionar problemas de um ambiente coletado
Como os ambientes coletados permitem um tempo de implantação mais rápido, é uma melhor prática primeiro explorar se um dos ambientes pré-criados coletados pode ser usado para executar seu código.
Você pode verificar se um ambiente coletado inclui todos os pacotes necessários examinando seus detalhes. Você pode testar usando o ambiente para executar o script.
Se um ambiente não incluir todos os pacotes necessários para executar seu código, o trabalho falhará.
Quando um trabalho falha, você pode examinar os logs de erros detalhados na guia Saídas + logs do trabalho no estúdio do Azure Machine Learning.
Uma mensagem de erro comum que indica que seu ambiente está incompleto é ModuleNotFoundError
. O módulo que não foi encontrado está listado na mensagem de erro. Examinando a mensagem de erro, você pode atualizar o ambiente para incluir as bibliotecas para garantir que os pacotes necessários sejam instalados no destino de computação antes de executar o código.
Quando precisar especificar outros pacotes necessários, você poderá usar um ambiente coletado como referência para seus próprios ambientes personalizados modificando os Dockerfiles que dão suporte a esses ambientes coletados.