Databricks Runtime para Machine Learning

Artigo
01/31/2025

Este artigo descreve o Databricks Runtime para Machine Learning e fornece diretrizes sobre como criar um cluster que o usa.

O que é o Databricks Runtime para Machine Learning?

O Databricks Runtime para Machine Learning (Databricks Runtime ML) automatiza a criação de um cluster com aprendizado de máquina pré-criado e infraestrutura de aprendizado profundo, incluindo as bibliotecas de ML e DL mais comuns.

Bibliotecas incluídas no Databricks Runtime para ML

O Databricks Runtime ML inclui uma variedade de bibliotecas de ML populares. As bibliotecas são atualizadas a cada versão para incluir novos recursos e correções.

O Databricks designou um subconjunto das bibliotecas com suporte como bibliotecas de camada superior. Para essas bibliotecas, o Databricks fornece uma cadência de atualização mais rápida, atualizando para as versões mais recentes do pacote com cada versão de runtime (exceto conflitos de dependência). O Databricks também fornece suporte avançado, testes e otimizações inseridas para bibliotecas de camada superior. As bibliotecas de alto nível são adicionadas ou removidas apenas com grandes lançamentos.

Para obter uma lista completa de bibliotecas de nível superior e outras fornecidas, consulte as notas de versão do Databricks Runtime ML.
Para obter informações sobre a frequência com que as bibliotecas são atualizadas e quando são consideradas obsoletas, consulte a política de manutenção do Databricks Runtime ML .

Você pode instalar bibliotecas adicionais para criar um ambiente personalizado para seu notebook ou cluster.

Para disponibilizar uma biblioteca para todos os notebooks em execução em um cluster, crie uma biblioteca de clusters. Use também um script de inicialização para instalar bibliotecas em clusters após a criação.
Para instalar uma biblioteca que fica disponível apenas para uma sessão específica de notebook, use bibliotecas do Python no escopo do notebook.

Configurar recursos de computação para o Databricks Runtime ML

O processo de criar recursos de computação com base no ML do Databricks Runtime depende se o workspace está habilitado para o Cluster do grupo dedicado em Visualização Pública ou não. Os workspaces habilitados para a versão prévia têm uma nova interface do usuário de computação simplificada.

Criar um cluster usando o Databricks Runtime ML

Quando você criar um cluster, selecione uma versão do Databricks Runtime ML no menu suspenso Versão do Databricks Runtime. Estão disponíveis runtimes de ML habilitados para CPU e GPU.

Selecionar o Databricks Runtime para ML

Se você selecionar um cluster no menu suspenso no notebook, a versão do Databricks Runtime aparecerá à direita do nome do cluster:

Exibir a Versão do Databricks Runtime ML

Se você selecionar um runtime de ML habilitado para GPU, será solicitado que selecione um Tipo de Driver e um Tipo de Trabalho compatíveis. Os tipos de instância incompatíveis ficam esmaecidos no menu suspenso. Os tipos de instância habilitados para GPU estão listados no rótulo Acelerada por GPU. Para obter informações sobre como criar clusters de GPU do Azure Databricks, consulte Computação habilitada para GPU. O Databricks Runtime ML inclui drivers de hardware de GPU e bibliotecas NVIDIA, como o CUDA.

Criar um novo cluster com a nova interface do usuário de computação simplificada

Use as etapas nesta seção apenas se o workspace estiver habilitado para a versão prévia do Cluster do grupo dedicado.

Para usar a versão de machine learning do Databricks Runtime, marque a caixa de seleção Machine learning.

Seleção de MLR da interface do usuário de computação

Para computação baseada em GPU, selecione um tipo de instância habilitada para GPU. Para obter a lista completa de tipos de GPU com suporte, consulte Tipos de instância com suporte.

ML do Photon e do Databricks Runtime

Ao criar um cluster de CPU executando o Databricks Runtime 15.2 ML ou superior, você pode optar por habilitar o Photon. O Photon melhora o desempenho de aplicativos usando Spark SQL, Spark DataFrames, engenharia de recursos, GraphFrames e xgboost4j. Não se espera que ele melhore o desempenho em aplicativos usando RDDs do Spark, UDFs do Pandas e linguagens não JVM, como Python. Assim, pacotes Python como XGBoost, PyTorch e TensorFlow não verão uma melhoria com o Photon.

As APIs do Spark RDD e do Spark MLlib têm compatibilidade limitada com o Photon. Ao processar grandes conjuntos de dados usando o Spark RDD ou o Spark MLlib, você pode enfrentar problemas de memória do Spark. Veja Problemas de memória Spark.

Modo de acesso para clusters ML do Databricks Runtime

Para acessar dados no Catálogo do Unity em um cluster executando o Databricks Runtime ML, você deve fazer um dos seguintes procedimentos:

Configurar o cluster usando modo de acesso de usuário único.
Configure o cluster usando o modo de acesso dedicado . O modo de acesso dedicado está atualmente na Visualização Pública. O modo de acesso dedicado fornece os recursos do modo de acesso compartilhado no Databricks Runtime ML.

Quando um recurso de computação tem acesso dedicado, o recurso pode ser atribuído a um único usuário ou grupo. Quando atribuído a um grupo (um cluster de grupo), as permissões do usuário reduzem automaticamente os escopos para as permissões do grupo, permitindo que o usuário compartilhe com segurança o recurso com outros membros do grupo.

Ao usar o modo de acesso de usuário único, os seguintes recursos só estão disponíveis no Databricks Runtime 15.4 LTS ML e acima:

Compartilhar via