Folha de truques de criação de computação
Este artigo tem como objetivo fornecer orientações claras e opinativas para a criação de computação. Usando os tipos de computação certos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar custos.
Best Practice (Melhores Práticas) | Impacto | Documentos |
---|---|---|
Se você é novo no Azure Databricks, comece usando tipos de instância gerais para todos os fins | A seleção do tipo de instância apropriado para a carga de trabalho resulta em maior eficiência. | - Criar um cluster |
Use o modo de acesso compartilhado, a menos que sua funcionalidade necessária não seja suportada | A computação com modo de acesso compartilhado pode ser usada por vários usuários com isolamento de dados entre os usuários. | - Modos de acesso |
Use os tipos de instância de última geração se houver disponibilidade suficiente | A última geração de tipos de instância oferece o melhor desempenho e os recursos mais recentes. | - Tipos de instância do Azure |
Defina seu equilíbrio de instâncias sob demanda e spot com base na rapidez com que você precisa que sua carga de trabalho seja executada | As instâncias spot economizam custos, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem recuperadas. | - Recomendações de configuração de computação |
Escolha o tamanho dos nós e o número de trabalhadores com base nos tipos de operações que sua carga de trabalho executa | Por exemplo, se você espera muitos embaralhamentos, pode ser mais eficiente usar um nó único grande em vez de vários nós menores. | - Considerações sobre dimensionamento de computação |
Execute vácuo em um cluster com dimensionamento automático definido para 1-4 trabalhadores, onde cada trabalhador tem 8 núcleos. Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM). |
As declarações de vácuo acontecem em duas fases, a segunda das quais é pesada. Se você não usar o cluster de tamanho correto, a operação pode causar uma lentidão e pode não ter êxito. | - Qual o tamanho do cluster que o vácuo precisa? - Melhores práticas VACUUM |
Avalie se seu fluxo de trabalho em lote se beneficiaria do Photon | O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho. | - Vantagens do fóton |