Gerenciando a fila de trabalhos
No Gerenciamento de Trabalhos, você pode monitorar e gerenciar trabalhos que são enviados para o cluster. Na lista de trabalhos, cada linha representa um trabalho e as colunas exibem propriedades do trabalho, estados de trabalho e valores de métrica. A lista de trabalhos fornece um ponto de partida para detalhar detalhes do trabalho e executar ações em um ou mais trabalhos.
A ordem da fila de trabalho é baseada no nível de prioridade do trabalho e no tempo de envio. Trabalhos com níveis de prioridade mais altos são executados antes de trabalhos de prioridade mais baixa. O tempo de envio do trabalho determina a ordem em cada nível de prioridade. Você pode ajudar a regular a ordem da fila de trabalho:
Criando modelos de trabalho que definem o intervalo de prioridade válido para diferentes tipos de trabalhos ou diferentes conjuntos de usuários.
Modificando o nível de prioridade dos trabalhos enviados para alterar a ordem da fila de trabalho. Você pode especificar Prioridade em termos de uma faixa de prioridade, um número de prioridade ou uma combinação dos dois. A prioridade numérica pode ter um valor entre 0 (o menor) e 4000 (mais alto).
Este tópico fornece uma visão geral de como você pode gerenciar e monitorar trabalhos de cluster.
Configurando políticas de agendamento de trabalho
Políticas de envio de trabalho: modelos de trabalho são seu método principal para definir políticas de envio de trabalho personalizado para seu cluster. Um modelo de trabalho permite associar um conjunto de valores padrão e restrições de valor para propriedades de trabalho (como nível de prioridade) a um determinado conjunto de usuários. Para obter mais informações, consulte Modelos de Trabalho.
Políticas de alocação de recursos: Configuração do agendador de trabalho determina como alocar recursos para trabalhos na fila. Ao configurar o Serviço de Agendador de Trabalho do HPC, você pode definir a política de agendamento (como modo balanceado ou enfileirado, preempção e backfilling), tratamento de erros e opções de histórico de trabalho. Para obter mais informações, consulte Configurar ado Serviço de Agendador de Trabalho do HPC.
imposição de política avançada e agendamento com reconhecimento de licença: Você pode impor políticas de envio de trabalho específicas do site e políticas de ativação de trabalho (como agendamento com reconhecimento de licença) criando filtros de envio de trabalho personalizados e filtros de ativação de trabalho. Para obter mais informações, consulte Noções básicas sobre a ativação e os filtros de envio.
Exibindo trabalhos e tarefas
trabalhos do Monitor: A lista de trabalhos exibe informações sobre trabalhos no cluster. Você pode filtrar e classificar a lista e escolher quais propriedades de trabalho e valores de métrica exibir na lista. Para obter mais informações, consulte Filtrar e Classificar a lista de trabalhos.
Detalhar detalhes do trabalho: Quando você clica em um trabalho na lista, informações detalhadas sobre esse trabalho são exibidas no painel de detalhes . Você também pode exibir os resultados do trabalho e da tarefa. Para obter mais informações, consulte Exibir um trabalho oude tarefa.
Acompanhar estatísticas de trabalho ao longo do tempo: Gerenciador de Cluster de HPC fornece vários gráficos e relatórios para acompanhar as estatísticas de trabalho do cluster. Para obter mais informações, consulte Gráficos e Relatórios: HPC Cluster Manager.
Executando ações de trabalho e tarefa
Como administrador de cluster ou como proprietário do trabalho, você pode executar as seguintes ações:
Cancelar um trabalho ou tarefa: remova um trabalho ou tarefa da fila e libere seus recursos.
forçar o cancelamento de um trabalho ou tarefa: interrompa um trabalho ou tarefa imediatamente.
Requeue um trabalho ou uma tarefa: coloque trabalhos ou tarefas inacabadas de volta na fila.
Modificar um trabalho: faça alterações nas propriedades do trabalho (como o nível de prioridade) ou adicione tarefas a trabalhos ativos.
Definir e Limpar Nós Excluídos para Trabalhos: se você observar que as tarefas falham consistentemente em um nó específico, poderá excluir esse nó de um ou mais trabalhos. Se você resolver problemas em um nó, poderá limpar esse nó da propriedade Nós Excluídos de qualquer trabalho ativo.
definir as propriedades de trabalho de progresso e progresso da mensagem: forneça informações de progresso personalizadas sobre um trabalho.
Copiar um trabalho oude tarefa: execute um trabalho novamente, as-isou com alterações.
salvar um trabalho ou tarefa em umde arquivo: exporte as especificações do trabalho ou da tarefa para um arquivo de descrição XML.
Nesta seção
cancelar um trabalho ou de tarefa
forçar o cancelamento de um trabalho ou de tarefa
modificar um de trabalho
definir as propriedades do trabalho de mensagem de progresso e progresso
salvar um trabalho ou tarefa em uma de arquivo