Identificar recursos do Azure Machine Learning

Concluído

Os recursos no Azure Machine Learning referem-se à infraestrutura de que necessita para executar um fluxo de trabalho de aprendizagem automática. O ideal é que alguém como um administrador crie e gerencie os recursos.

Os recursos no Azure Machine Learning incluem:

  • A área de trabalho
  • Recursos de computação
  • Arquivos de dados

Criar e gerenciar o espaço de trabalho

O espaço de trabalho é o recurso de nível superior para o Azure Machine Learning. Os cientistas de dados precisam ter acesso ao espaço de trabalho para treinar e rastrear modelos e implantar os modelos em pontos de extremidade.

No entanto, você deve ter cuidado com quem tem acesso total ao espaço de trabalho. Ao lado de referências a recursos de computação e armazenamentos de dados, você pode encontrar todos os logs, métricas, saídas, modelos e instantâneos do seu código no espaço de trabalho.

Criar e gerir recursos de computação

Um dos recursos mais importantes de que você precisa ao treinar ou implantar um modelo é a computação. Há cinco tipos de computação no espaço de trabalho do Azure Machine Learning:

  • Instâncias de computação: semelhante a uma máquina virtual na nuvem, gerenciada pelo espaço de trabalho. Ideal para usar como um ambiente de desenvolvimento para executar notebooks (Jupyter).
  • Clusters de computação: clusters sob demanda de nós de computação de CPU ou GPU na nuvem, gerenciados pelo espaço de trabalho. Ideal para uso em cargas de trabalho de produção, pois elas são dimensionadas automaticamente de acordo com suas necessidades.
  • Clusters Kubernetes: Permite criar ou anexar um cluster do Serviço Kubernetes do Azure (AKS). Ideal para implantar modelos treinados de aprendizado de máquina em cenários de produção.
  • Cálculos anexados: Permite anexar outros recursos de computação do Azure ao espaço de trabalho, como o Azure Databricks ou pools Synapse Spark.
  • Computação sem servidor: uma computação sob demanda totalmente gerenciada que você pode usar para trabalhos de treinamento.

Nota

Como o Azure Machine Learning cria e gerencia computação sem servidor para você, ele não está listado na página de computação no estúdio. Saiba mais sobre como usar a computação sem servidor para treinamento de modelos

Embora a computação seja o recurso mais importante ao trabalhar com cargas de trabalho de aprendizado de máquina, também pode ser o mais dispendioso. Portanto, uma prática recomendada é permitir apenas que os administradores criem e gerenciem recursos de computação. Os cientistas de dados não devem ter permissão para editar computação, mas apenas usar a computação disponível para executar suas cargas de trabalho.

Criar e gerenciar armazenamentos de dados

O espaço de trabalho não armazena dados em si. Em vez disso, todos os dados são armazenados em armazenamentos de dados, que são referências aos serviços de dados do Azure. As informações de conexão a um serviço de dados que um armazenamento de dados representa são armazenadas no Cofre da Chave do Azure.

Quando um espaço de trabalho é criado, uma conta de Armazenamento do Azure é criada e conectada automaticamente ao espaço de trabalho. Como resultado, você tem quatro armazenamentos de dados já adicionados ao seu espaço de trabalho:

  • workspaceartifactstore: Conecta-se azureml ao contêiner da conta de Armazenamento do Azure criada com o espaço de trabalho. Usado para armazenar logs de computação e experimento ao executar trabalhos.
  • workspaceworkingdirectory: Conecta-se ao compartilhamento de arquivos da conta de Armazenamento do Azure criada com o espaço de trabalho usado pela seção Blocos de Anotações do estúdio. Sempre que você carrega arquivos ou pastas para acessar a partir de uma instância de computação, os arquivos ou pastas são carregados para esse compartilhamento de arquivos.
  • workspaceblobstore: Conecta-se ao Armazenamento de Blob da conta de Armazenamento do Azure criada com o espaço de trabalho. Especificamente o azureml-blobstore-... recipiente. Defina como o armazenamento de dados padrão, o que significa que sempre que você cria um ativo de dados e carrega dados, armazena os dados nesse contêiner.
  • workspacefilestore: Conecta-se ao compartilhamento de arquivos da conta de Armazenamento do Azure criada com o espaço de trabalho. Especificamente o azureml-filestore-... compartilhamento de arquivos.

Além disso, você pode criar armazenamentos de dados para se conectar a outros serviços de dados do Azure. Mais comumente, seus armazenamentos de dados se conectam a uma Conta de Armazenamento do Azure ou ao Armazenamento do Azure Data Lake (Gen2), pois esses serviços de dados são usados com mais frequência em projetos de ciência de dados.