Explorar e usar ambientes coletados

Concluído

Ambientes coletados são ambientes predefinidos para as cargas de trabalho de aprendizado de máquina mais comuns, disponíveis em seu workspace por padrão.

Os ambientes coletados usam o prefixo AzureML - e são projetados para fornecer scripts que usam estruturas e ferramentas populares de aprendizado de máquina.

Por exemplo, há ambientes coletados para quando você deseja executar um script que treina um modelo de regressão, clustering ou classificação com o Scikit-Learn.

Para explorar um ambiente coletado, você poderá exibir no estúdio usando a CLI do Azure ou o SDK do Python.

O comando a seguir permite recuperar a descrição e as tags de um ambiente coletado com o SDK do Python:

env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)

Usar o ambiente coletado

Normalmente, você usa ambientes quando deseja executar um script como um trabalho (comando).

Para especificar qual ambiente você deseja usar para executar o script, faça referência a um ambiente por seu nome e versão.

Por exemplo, o código a seguir mostra como configurar um trabalho de comando com o SDK do Python, que usa um ambiente coletado, incluindo o Scikit-Learn:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    display_name="train-with-curated-environment",
    experiment_name="train-with-curated-environment"
)

# submit job
returned_job = ml_client.create_or_update(job)

Testar e solucionar problemas de um ambiente coletado

Como os ambientes coletados permitem um tempo de implantação mais rápido, é uma melhor prática primeiro explorar se um dos ambientes pré-criados coletados pode ser usado para executar seu código.

Você pode verificar se um ambiente coletado inclui todos os pacotes necessários examinando seus detalhes. Você pode testar usando o ambiente para executar o script.

Se um ambiente não incluir todos os pacotes necessários para executar seu código, o trabalho falhará.

Quando um trabalho falha, você pode examinar os logs de erros detalhados na guia Saídas + logs do trabalho no estúdio do Azure Machine Learning.

Uma mensagem de erro comum que indica que seu ambiente está incompleto é ModuleNotFoundError. O módulo que não foi encontrado está listado na mensagem de erro. Examinando a mensagem de erro, você pode atualizar o ambiente para incluir as bibliotecas para garantir que os pacotes necessários sejam instalados no destino de computação antes de executar o código.

Quando precisar especificar outros pacotes necessários, você poderá usar um ambiente coletado como referência para seus próprios ambientes personalizados modificando os Dockerfiles que dão suporte a esses ambientes coletados.