Identificar recursos do Azure Machine Learning
Os recursos do Azure Machine Learning referem-se à infraestrutura necessária para executar um fluxo de trabalho de machine learning. O ideal é que alguém, como um administrador, crie e gerencie os recursos.
Os recursos no Azure Machine Learning incluem:
- O espaço de trabalho
- Recursos de computação
- Armazenamentos de dados
Criar e gerenciar o workspace
O workspace é o recurso de nível superior do Azure Machine Learning. Os cientistas de dados precisam acessar o espaço de trabalho para treinar e acompanhar modelos e para implantar os modelos em pontos de extremidade.
Mas você precisa ter cuidado com quem tem acesso total ao workspace. Ao lado de referências a recursos de computação e armazenamentos de dados, você pode encontrar todos os logs, métricas, saídas, modelos e instantâneos do seu código no workspace.
Criar e gerenciar recursos de computação
Um dos recursos mais importantes necessários ao treinar ou implantar um modelo é a computação. Existem cinco tipos de computação no Workspace do Azure Machine Learning:
- Instâncias de Computação: De modo semelhante a uma máquina virtual na nuvem, gerenciada pelo espaço de trabalho. Ideal para usar como um ambiente de desenvolvimento para executar notebooks (Jupyter).
- Clusters de Computação: Clusters sob demanda de nós de computação de CPU ou GPU na nuvem, gerenciados pelo espaço de trabalho. Ideal para usar com cargas de trabalho de produção à medida que elas são dimensionadas automaticamente de acordo com suas necessidades.
- Clusters do Kubernetes: Permite que você crie ou anexe um cluster do Serviço de Kubernetes do Azure (AKS). Ideal para implantar modelos de machine learning treinados em cenários de produção.
- Computação Anexada: Permite que você anexe outros recursos de computação do Azure ao espaço de trabalho, como pools do Azure Databricks ou do Synapse Spark.
- Computação sem servidor: Uma computação totalmente gerenciada e sob demanda que você pode utilizar para trabalhos de treinamento.
Observação
Como o Azure Machine Learning cria e gerencia a computação sem servidor para você, ele não está listado na página de computação no estúdio. Saiba mais sobre como utilizar a computação sem servidor para o treinamento de modelos
Embora a computação seja o recurso mais importante ao trabalhar com cargas de trabalho de aprendizado de máquina, ela também pode aumentar os custos. Portanto, a melhor prática é permitir que apenas que os administradores criem e gerenciem recursos de computação. Os cientistas de dados não devem ter permissão para editar a computação, mas devem usar apenas a computação disponível para executar suas cargas de trabalho.
Criar e gerenciar armazenamentos de dados
O workspace não armazena nenhum dado em si. Em vez disso, todos os dados são colocados em armazenamentos de dados, que são referências aos serviços de dados do Azure. As informações de conexão ao serviço de dados que o armazenamento de dados representa são armazenadas no Azure Key Vault.
Quando um workspace é criado, uma conta de Armazenamento do Microsoft Azure é automaticamente criada e conectada ao workspace. Como resultado, você já tem quatro armazenamentos de dados adicionados ao seu espaço de trabalho:
workspaceartifactstore
: Conecta-se ao contêinerazureml
da conta de Armazenamento do Microsoft Azure criada com o espaço de trabalho. Usado para armazenar os logs de computação e de experimentos ao executar trabalhos.workspaceworkingdirectory
: Conecta-se ao compartilhamento de arquivos da conta de Armazenamento do Microsoft Azure criada com o espaço de trabalho utilizado pela seção Notebooks do estúdio. Sempre que você carregar arquivos ou pastas para acessar a partir de uma instância de computação, os arquivos ou pastas serão carregados nesse compartilhamento de arquivos.workspaceblobstore
: conecta-se ao Armazenamento de Blobs da conta do Armazenamento do Microsoft Azure criada com o workspace. Especificamente o contêinerazureml-blobstore-...
. Defina como o repositório de dados padrão, o que significa que sempre que você criar um ativo de dados e carregar dados, os dados serão armazenados nesse contêiner.workspacefilestore
: conecta-se ao compartilhamento de arquivos da conta do Armazenamento do Microsoft Azure criada com o workspace. Especificamente o compartilhamento de arquivosazureml-filestore-...
.
E você pode criar armazenamentos de dados para se conectar a outros serviços de dados do Azure. Na maioria das vezes, seus armazenamento de dados se conectam a uma Conta de Armazenamento do Azure ou ao Azure Data Lake Storage (Gen2), pois esses serviços de dados são usados com mais frequência em projetos de ciência de dados.