Noções básicas sobre a configuração de política
As configurações de configuração de política controlam como os recursos são alocados para trabalhos em fila ou em execução. O modo de agendamento permite otimizar a alocação de recursos para cargas de trabalho de lote e MPI grandes ou para cargas de trabalho de serviço. Para obter informações sobre como alterar as opções de configuração, consulte Configurar o serviço de agendador de trabalho do HPC.
A tabela a seguir resume os dois modos de agendamento e suas configurações padrão:
Enfileirado | Balanceado | |
---|---|---|
descrição | Inicie trabalhos na ordem da fila e tente alocar o máximo de recursos solicitados para trabalhos em execução. – Concluir trabalhos de prioridade mais alta o mais rápido possível – Tentar fornecer aos trabalhos o máximo de recursos solicitados - Minimizar o tempo de execução do trabalho - Espera mais longa na fila de trabalho para trabalhos de prioridade mais baixa – Os recursos disponíveis são usados primeiro para atender à solicitação máxima de recursos de trabalhos em execução e, em seguida, para iniciar novos trabalhos (quando a alocação de recursos adaptáveis (adulto/redução) está habilitada) |
Tente iniciar todos os trabalhos de entrada o mais rápido possível em seus requisitos mínimos de recursos. Se recursos adicionais estiverem disponíveis, aumente os trabalhos com base na prioridade. – Iniciar todos os trabalhos de entrada o mais rápido possível – Comece fornecendo aos trabalhos seus recursos mínimos e, em seguida, adicione recursos, se possível, equilibrando com base na prioridade e nos recursos solicitados - Minimizar o tempo de espera na fila de trabalho – Os trabalhos demoram mais para serem concluídos - Os recursos podem ser obtidos da execução de trabalhos para iniciar novos trabalhos, mesmo que a execução tenha uma prioridade mais alta |
Otimizado para | – MPI grande e trabalhos em lotes – Tarefas de execução longa - Varreduras paramétricas |
– Cargas de trabalho interativas, como trabalhos soa (arquitetura orientada a serviço) e aplicativos de tipo de serviço – Tarefas de execução curta - Varreduras paramétricas |
Configurações adicionais |
-
de Preempção Padrão: preempção normal - alocação de recursos adaptáveis (crescer/reduzir) Padrão: aumentar e diminuir recursos automaticamente habilitados Consulte configurações de modo enfileirado neste tópico. |
-
de Preempção Padrão: preempção imediata Observação: configurações de preempção só podem ser configuradas no modo Balanceado, começando com o HPC Pack 2012 com Service Pack 1 (SP1). Nas versões anteriores, no modo Balanceado, a preempção é sempre Imediata. de viés de prioridade Padrão: Viés Médio - intervalo de reequilíbrio Padrão: 10 segundos Consulte configurações de modo balanceado neste tópico. |
Configurações de modo enfileirado
No modo enfileirado, o Serviço de Agendador de Trabalho do HPC inicia trabalhos na ordem da fila e tenta alocar o máximo de recursos solicitados para trabalhos em execução. As seções a seguir descrevem as configurações de preempção e alocação de recursos adaptáveis associadas ao modo enfileirado.
Preempção de trabalho
A preempção permite que trabalhos de prioridade mais alta que estão aguardando na fila comecem mais cedo tirando recursos da prioridade mais baixa, trabalhos preemptíveis que já estão em execução. Se você habilitar a política de Aumentar por preempção (consulte "Alocação de recursos adaptáveis" abaixo), a preempção também será usada para ajudar a aumentar a prioridade, executando trabalhos para sua solicitação máxima de recursos (disponível a partir do HPC Pack 2008 R2 com Service Pack 2 (SP2).
Nota
A propriedade de trabalho Preemptable é definida pelo administrador em modelos de trabalho. Use modelos de trabalho para definir os tipos de trabalhos que podem ser preempíveis ou os conjuntos de usuários que podem enviar trabalhos preemptíveis ou não preempíveis. preempível não pode ser definido ao enviar um trabalho por meio do Gerenciador de Cluster HPC, do HPC Job Manager, do HPC PowerShell ou das ferramentas de linha de comando do HPC. Só é possível fazer isso usando a API do HPC se o modelo de trabalho selecionado especificar True e False como valores válidos para a propriedade Preemptable trabalho.
A preempção no modo enfileirado tem as seguintes opções:
preempção normal (Padrão): tire recursos do trabalho preempido à medida que suas tarefas em execução são concluídas para que o trabalho não seja perdido.
de preempção imediata: tire recursos do trabalho preempto cancelando todas as tarefas em execução para que os recursos possam ser alocados para o trabalho de alta prioridade imediatamente. Para obter mais informações sobre o cancelamento de tarefas e trabalhos, consulte a seção Considerações Adicionais em Cancelar um Trabalho oude Tarefa.
preempção de nível de tarefa (introduzido no HPC Pack 2008 R2 com SP3): habilite a preempção de tarefas individuais em vez de trabalhos inteiros. Com as configurações de preempção imediata padrão, o agendador cancelará um trabalho inteiro se algum de seus recursos for necessário para um trabalho de prioridade mais alta. Quando você habilitar a preempção de nível de tarefa, o agendador cancelará tarefas individuais. Por exemplo, se um trabalho de prioridade normal estiver executando 100 tarefas em 1 núcleo cada, e um trabalho de alta prioridade for enviado que exija 10 núcleos, a preempção de nível de tarefa cancelará 10 tarefas, em vez de cancelar todo o trabalho. Essa opção pode melhorar a taxa de transferência do trabalho minimizando a quantidade de retrabalho que deve ser feita devido à preempção.
Nota
A partir do HPC Pack 2012, no modo de agendamento enfileirado, a opção padrão para o comportamento de preempção é a preempção imediata no nível da tarefa, em vez da preempção no nível do trabalho. Esse comportamento padrão significa que apenas quantas tarefas de trabalhos de baixa prioridade forem preempidas conforme necessário para fornecer os recursos necessários para os trabalhos de prioridade mais alta, em vez de prever todas as tarefas nos trabalhos de baixa prioridade.
Nota
A partir do HPC Pack 2012 com o Service Pack 1 (SP1), um trabalho de SOA (arquitetura orientada a serviço) encerrará as tarefas após a conclusão da solicitação atual, mesmo se houver solicitações adicionais a serem calculadas. Nas versões anteriores do HPC Pack, um trabalho SOA encerrará suas tarefas para liberar recursos para outro trabalho somente depois que todas as solicitações forem calculadas.
Semde preempção: não preempcione trabalhos.
Alocação de recursos adaptáveis
A alocação de recursos adaptáveis ajusta dinamicamente os recursos alocados para um trabalho com base em suas tarefas. Habilitar ajustes de recursos pode resultar em uma melhoria significativa na utilização do cluster e na redução dos tempos de fila de trabalho, especialmente para clusters que executam trabalhos compostos por várias tarefas, como cálculos de varredura paramétrica. Somente trabalhos que contêm mais de uma tarefa ou subtarefa podem se beneficiar do ajuste automático de recursos.
A alocação adaptável tem as seguintes configurações que podem ser habilitadas ou desabilitadas:
Aumentar recursos automaticamente (habilitados por padrão): use os recursos disponíveis para aumentar a prioridade mais alta, executando trabalhos ao máximo antes de iniciar trabalhos de prioridade mais baixa. Com o crescimento automático habilitado, o Serviço de Agendador de Trabalho do HPC pode alocar recursos gratuitos para trabalhos em execução que têm tarefas adicionais a serem executadas. O serviço não alocará mais recursos do que o máximo solicitado para o trabalho. Isso resulta em trabalhos gastando mais tempo na fila aguardando recursos, mas eles terminam mais rapidamente depois de serem iniciados. Os recursos disponíveis são alocados primeiro para o trabalho de prioridade mais alta do sistema, seja ele em execução ou na fila.
- Crescer por de preempção (introduzido no HPC Pack 2008 R2 com SP2): para ajudar a aumentar a prioridade mais alta dos trabalhos em execução ao máximo, use a preempção para tirar recursos da prioridade mais baixa, executando trabalhos. A preempção deve ser habilitada para usar essa configuração.
Diminuir recursos automaticamente (habilitado por padrão): com a redução automática habilitada, o Serviço de Agendador de Trabalho do HPC pode liberar recursos não utilizados da execução de trabalhos que não têm tarefas adicionais para execução. O serviço não reduzirá os recursos abaixo do mínimo solicitado para o trabalho. A redução automática resulta em uma melhor utilização geral do cluster, mas pode causar problemas se você adicionar tarefas a trabalhos que já estão em andamento.
Nota
No modelo de trabalho padrão, as propriedades do trabalho Calcular o máximo de e Auto Calculate Minimãe são definidas como um valor padrão de True. Se um modelo de trabalho especificar que True é o único valor válido para essas propriedades, o usuário que envia não terá a opção de especificar recursos máximos e mínimos para um trabalho enviado com esse modelo, e os recursos serão calculados automaticamente com base nas tarefas no trabalho.
Configurações de modo equilibrado
No modo Balanceado, o Serviço de Agendador de Trabalho do HPC tenta iniciar todos os trabalhos de entrada o mais rápido possível em seus requisitos mínimos de recursos. Depois que todos os trabalhos na fila tiverem seus recursos mínimos, recursos de cluster adicionais são alocados para trabalhos com base em sua prioridade. A alocação de recursos é rebalanceada periodicamente para preencher recursos ociosos, iniciar novos trabalhos e ajustar a alocação de acordo com a configuração de Viés de Prioridade
Nota
- O agendamento equilibrado é limitado em situações em que os grupos de nós se sobrepõem. O modo balanceado é mais eficaz em grupos de nós não sobrepostos.
- Se você especificar que um trabalho deve ser executado em um único nó (disponível a partir do HPC Pack 2012), o balanceamento executado pelo Serviço de Agendador de Trabalho do HPC pode ser limitado por outros trabalhos em execução no cluster.
Preempção de trabalho
A preempção no modo Balanceado permite que os trabalhos que estão aguardando na fila comecem mais cedo tirando recursos de trabalhos preemptíveis que já estão em execução.
Importante
As configurações de preempção no modo Balanceado só podem ser configuradas por um administrador de HPC a partir do HPC Pack 2012 com o Service Pack 1 (SP1). Nas versões anteriores do HPC Pack, a preempção no modo Balanceado é sempre Imediata.
Nota
A propriedade de trabalho Preemptable é definida pelo administrador em modelos de trabalho. Use modelos de trabalho para definir os tipos de trabalhos que podem ser preempíveis ou os conjuntos de usuários que podem enviar trabalhos preemptíveis ou não preempíveis. preempível não pode ser definido ao enviar um trabalho por meio do Gerenciador de Cluster HPC, do HPC Job Manager, do HPC PowerShell ou das ferramentas de linha de comando do HPC. Só é possível fazer isso usando a API do HPC se o modelo de trabalho selecionado especificar True e False como valores válidos para a propriedade Preemptable trabalho. (O padrão é True.)
A preempção no modo Balanceado tem as seguintes opções:
de preempção imediata (Padrão): tire recursos do trabalho preempcionado cancelando e requeundo tarefas de execução suficientes para que os recursos possam ser alocados para outro trabalho imediatamente. Para a maioria das cargas de trabalho de cluster, a preempção imediata no modo Balanceado permite que mais trabalhos comecem em um determinado período de tempo. Por esse motivo, é recomendável, na maioria dos casos, alcançar o agendamento equilibrado.
preempção normal: tire recursos do trabalho preempido à medida que suas tarefas em execução são concluídas para que o trabalho não seja perdido. Essa é uma configuração avançada que só deve ser habilitada para cargas de trabalho específicas. Por exemplo, pode ser considerado ao usar o modo Balanceado com trabalhos soa (arquitetura orientada a serviço) que consistem em tarefas de execução longa, em que é fundamental manter os resultados reajustados por cada tarefa intermediária.
Cuidado
A preempção normal no modo Balanceado pode diminuir o tempo de resposta de iniciar um novo trabalho e pode reduzir a velocidade de balanceamento. O cluster deve ser cuidadosamente testado e monitorado quando a preempção normal no modo Balanceado estiver habilitada. Para obter mais informações, consulte as seguintes considerações adicionais.
Considerações adicionais sobre a preempção no modo balanceado
velocidade de balanceamento modo balanceado tenta equilibrar trabalhos o mais rápido possível, usando a preempção imediata por padrão. Se você optar por habilitar a preempção normal no modo Balanceado, o balanceamento só poderá ocorrer na taxa em que as tarefas são encerradas. Se houver tarefas de execução prolongada no cluster, o balanceamento poderá levar muito tempo. Se a taxa de trabalhos de entrada exceder a taxa das tarefas de saída, o cluster só será balanceado quando as tarefas suficientes forem encerradas para realocar os recursos.
Utilização de recursos Por padrão no modo Balanceado, o Serviço de Agendador de Trabalho do HPC imediatamente preempõe tarefas para liberar os recursos (como núcleos, nós ou soquetes) necessários para qualquer trabalho de espera. No entanto, se a preempção normal estiver habilitada, os recursos serão liberados à medida que as tarefas forem encerradas, independentemente dos requisitos de recursos de um trabalho de espera. É possível que os recursos liberados não sejam os necessários para o próximo trabalho de espera e os recursos possam permanecer ociosos até que outras tarefas sejam concluídas.
Viés de prioridade
de Viés de Prioridade controla como recursos adicionais são alocados para trabalhos. No modo Balanceado, "recursos adicionais" referem-se ao recurso de cluster acima do total de recursos mínimos para todos os trabalhos em execução. Tarefas em execução em recursos adicionais podem ser canceladas com preempção imediata para acomodar novos trabalhos ou convergir no padrão de alocação desejado.
de Viés de Prioridade tem as seguintes opções:
de Alto Viés: todos os recursos adicionais são alocados para trabalhos de prioridade mais alta.
de Viés Médio (Padrão): cada faixa de prioridade recebe uma proporção maior de recursos adicionais do que a banda abaixo dela. As faixas de prioridade são
mais altas, Acima do Normal,Normal , Abaixo do Normal eo menor .Semde Viés: recursos adicionais são alocados igualmente na fila de trabalho.
Intervalo de rebalanceamento
O intervalo de reequilíbrio
Um intervalo mais longo pode melhorar o desempenho do agendador, mas pode levar mais tempo para responder a novos trabalhos e convergir no padrão de alocação desejado. Intervalos mais longos são bons se você não precisar de crescimento instantâneo e redução. Se o cluster tiver uma alta taxa de reviravolta (os trabalhos são enviados com frequência e terminam rapidamente), talvez você queira um intervalo mais longo para evitar o crescimento excessivo e a redução.
Um intervalo de reequilíbrio mais curto fornece uma resposta mais rápida quando novos trabalhos são enviados, ao custo de carga adicional no nó principal. As outras configurações que você pode ajustar se precisar de respostas mais rápidas são o Período de Carência de Cancelamento de Tarefa e o Tempo Limite da Tarefa de Liberação, o que pode levar mais tempo para que o trabalho em execução seja empurrado para fora do caminho.
Referências adicionais
Configurar a de Serviço do Agendador de Trabalho do HPC
cancelar um trabalho ou de tarefa