Partilhar via


Folha de truques de criação de computação

Este artigo tem como objetivo fornecer orientações claras e opinativas para a criação de computação. Usando os tipos de computação certos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar custos.

Best Practice (Melhores Práticas) Impacto Documentos
Se você é novo no Azure Databricks, comece usando tipos de instância gerais para todos os fins A seleção do tipo de instância apropriado para a carga de trabalho resulta em maior eficiência. - Criar um cluster
Use o modo de acesso compartilhado, a menos que sua funcionalidade necessária não seja suportada A computação com modo de acesso compartilhado pode ser usada por vários usuários com isolamento de dados entre os usuários. - Modos de acesso
Use os tipos de instância de última geração se houver disponibilidade suficiente A última geração de tipos de instância oferece o melhor desempenho e os recursos mais recentes. - Tipos de instância do Azure
Defina seu equilíbrio de instâncias sob demanda e spot com base na rapidez com que você precisa que sua carga de trabalho seja executada As instâncias spot economizam custos, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem recuperadas. - Recomendações de configuração de computação
Escolha o tamanho dos nós e o número de trabalhadores com base nos tipos de operações que sua carga de trabalho executa Por exemplo, se você espera muitos embaralhamentos, pode ser mais eficiente usar um nó único grande em vez de vários nós menores. - Considerações sobre dimensionamento de computação
Execute vácuo em um cluster com dimensionamento automático definido para 1-4 trabalhadores, onde cada trabalhador tem 8 núcleos.

Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM).
As declarações de vácuo acontecem em duas fases, a segunda das quais é pesada. Se você não usar o cluster de tamanho correto, a operação pode causar uma lentidão e pode não ter êxito. - Qual o tamanho do cluster que o vácuo precisa?
- Melhores práticas VACUUM
Avalie se seu fluxo de trabalho em lote se beneficiaria do Photon O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho. - Vantagens do fóton