Escolha o destino de computação apropriado

Concluído

No Azure Machine Learning, os destinos de computação são computadores físicos ou virtuais nos quais os trabalhos são executados.

Compreender os tipos de computação disponíveis

O Azure Machine Learning dá suporte a vários tipos de computação para experimentação, treinamento e implantação. Ao ter vários tipos de computação, você pode selecionar o tipo de destino de computação mais apropriado para suas necessidades.

Diagram of different hyperparameter values resulting in different models by performing hyperparameter tuning.

  • Instância de computação: se comporta de forma semelhante a uma máquina virtual e é usada principalmente para executar blocos de anotações. É ideal para experimentação.
  • Clusters de computação: clusters de vários nós de máquinas virtuais que aumentam ou diminuem automaticamente a escala para atender à demanda. Uma maneira econômica de executar scripts que precisam processar grandes volumes de dados. Os clusters também permitem que você use o processamento paralelo para distribuir a carga de trabalho e reduzir o tempo necessário para executar um script.
  • Clusters Kubernetes: cluster baseado na tecnologia Kubernetes, oferecendo mais controle sobre como a computação é configurada e gerenciada. Você pode anexar seu cluster Kubernetes do Azure (AKS) autogerenciado para computação em nuvem ou um cluster Arc Kubernetes para cargas de trabalho locais.
  • Computação anexada: permite anexar computação existente, como máquinas virtuais do Azure ou clusters do Azure Databricks, ao seu espaço de trabalho.
  • Computação sem servidor: uma computação sob demanda totalmente gerenciada que você pode usar para trabalhos de treinamento.

Nota

O Azure Machine Learning oferece-lhe a opção de criar e gerir a sua própria computação ou de utilizar computação que é totalmente gerida pelo Azure Machine Learning.

Quando usar que tipo de computação?

Em geral, existem algumas práticas recomendadas que você pode seguir ao trabalhar com destinos de computação. Para entender como escolher o tipo apropriado de computação, vários exemplos são fornecidos. Lembre-se de que o tipo de computação que você usa sempre depende da sua situação específica.

Escolha um destino de computação para experimentação

Imagine que você é um cientista de dados e é solicitado a desenvolver um novo modelo de aprendizado de máquina. Você provavelmente tem um pequeno subconjunto dos dados de treinamento com o qual pode experimentar.

Durante a experimentação e o desenvolvimento, você prefere trabalhar em um notebook Jupyter. Uma experiência de bloco de notas beneficia mais de uma computação em execução contínua.

Muitos cientistas de dados estão familiarizados com a execução de blocos de anotações em seus dispositivos locais. Uma alternativa de nuvem gerenciada pelo Azure Machine Learning é uma instância de computação. Como alternativa, você também pode optar pela computação sem servidor do Spark para executar o código do Spark em notebooks, se quiser usar o poder de computação distribuído do Spark.

Escolha um destino de computação para produção

Após a experimentação, você pode treinar seus modelos executando scripts Python para se preparar para a produção. Os scripts serão mais fáceis de automatizar e programar para quando você quiser treinar seu modelo continuamente ao longo do tempo. Você pode executar scripts como trabalhos (pipeline).

Ao passar para a produção, você deseja que o destino de computação esteja pronto para lidar com grandes volumes de dados. Quanto mais dados você usar, melhor será o modelo de aprendizado de máquina.

Ao treinar modelos com scripts, você deseja um destino de computação sob demanda. Um cluster de computação aumenta automaticamente quando o(s) script(s) precisa(m) ser executado(s) e diminui quando o script termina de ser executado. Se quiser uma alternativa que não precisa criar e gerenciar, você pode usar a computação sem servidor do Azure Machine Learning.

Escolha um destino de computação para implantação

O tipo de computação que você precisa ao usar seu modelo para gerar previsões depende se você deseja previsões em lote ou em tempo real.

Para previsões em lote, você pode executar um trabalho de pipeline no Aprendizado de Máquina do Azure. Destinos de computação como clusters de computação e computação sem servidor do Azure Machine Learning são ideais para trabalhos de pipeline, pois são sob demanda e escaláveis.

Quando você deseja previsões em tempo real, você precisa de um tipo de computação que esteja sendo executado continuamente. Portanto, as implantações em tempo real se beneficiam de uma computação mais leve (e, portanto, mais econômica). Os contêineres são ideais para implantações em tempo real. Quando você implanta seu modelo em um ponto de extremidade online gerenciado, o Aprendizado de Máquina do Azure cria e gerencia contêineres para você executar seu modelo. Como alternativa, você pode anexar clusters do Kubernetes para gerenciar a computação necessária para gerar previsões em tempo real.