Partilhar via


Folha de truques de criação de computação

Este artigo tem como objetivo fornecer orientações claras e opinativas para a criação de computação. Usando os tipos de computação certos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar custos.

Best Practice (Melhores Práticas) Impacto Documentos
Se você é novo no Azure Databricks, comece usando tipos de instância gerais para todos os fins A seleção do tipo de instância apropriado para a carga de trabalho resulta em maior eficiência.
Use o modo de acesso padrão, a menos que sua funcionalidade necessária não seja suportada A computação com modo de acesso padrão pode ser usada por vários usuários com isolamento de dados entre os usuários.
Use os tipos de instância de última geração se houver disponibilidade suficiente A última geração de tipos de instância oferece o melhor desempenho e os recursos mais recentes.
Defina o equilíbrio entre as instâncias on-demand e spot-instance com base na rapidez com que necessita que a sua carga de trabalho seja executada. As instâncias spot economizam custos, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem recuperadas.
Escolha o tamanho dos seus nós e o número de recursos com base nos tipos de operações que a sua carga de trabalho executa. Por exemplo, se se esperam muitas trocas, pode ser mais eficiente usar um único nó grande em vez de vários nós menores.
Execute vácuo em um cluster com dimensionamento automático definido para 1-4 trabalhadores, onde cada trabalhador tem 8 núcleos.
Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM).
As declarações de vácuo acontecem em duas fases, a segunda das quais é pesada. Se você não usar o cluster de tamanho correto, a operação pode causar uma lentidão e pode não ter êxito.
Avalie se seu fluxo de trabalho em lote se beneficiaria do Photon O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho.