Folha de truques de criação de computação
Este artigo tem como objetivo fornecer orientações claras e opinativas para a criação de computação. Usando os tipos de computação certos para seu fluxo de trabalho, você pode melhorar o desempenho e economizar custos.
Best Practice (Melhores Práticas) | Impacto | Documentos |
---|---|---|
Se você é novo no Azure Databricks, comece usando tipos de instância gerais para todos os fins | A seleção do tipo de instância apropriado para a carga de trabalho resulta em maior eficiência. | |
Use o modo de acesso padrão, a menos que sua funcionalidade necessária não seja suportada | A computação com modo de acesso padrão pode ser usada por vários usuários com isolamento de dados entre os usuários. | |
Use os tipos de instância de última geração se houver disponibilidade suficiente | A última geração de tipos de instância oferece o melhor desempenho e os recursos mais recentes. | |
Defina o equilíbrio entre as instâncias on-demand e spot-instance com base na rapidez com que necessita que a sua carga de trabalho seja executada. | As instâncias spot economizam custos, mas podem afetar o tempo de execução geral de uma operação se as instâncias spot forem recuperadas. | |
Escolha o tamanho dos seus nós e o número de recursos com base nos tipos de operações que a sua carga de trabalho executa. | Por exemplo, se se esperam muitas trocas, pode ser mais eficiente usar um único nó grande em vez de vários nós menores. | |
Execute vácuo em um cluster com dimensionamento automático definido para 1-4 trabalhadores, onde cada trabalhador tem 8 núcleos. Selecione um driver com entre 8 e 32 núcleos. Aumente o tamanho do driver se você receber erros de falta de memória (OOM). |
As declarações de vácuo acontecem em duas fases, a segunda das quais é pesada. Se você não usar o cluster de tamanho correto, a operação pode causar uma lentidão e pode não ter êxito. | |
Avalie se seu fluxo de trabalho em lote se beneficiaria do Photon | O Photon fornece consultas mais rápidas e reduz o custo total por carga de trabalho. |