Partilhar via


Noções básicas sobre estados, integridade e operações do nó

Estado do Nó reflete o estado de implantação de um nó e se um administrador deseja ou não que o nó esteja disponível como um recurso para trabalhos de cluster. Um administrador traz um nó para o estado Online para indicar que o nó deve aceitar trabalhos ou solicitações de cliente.

de Integridade do Nó indica se há ou não avisos ou erros que os serviços de HPC estão cientes nesse nó. Se o nó tiver um valor de integridade do nó de Erro, o nó não poderá aceitar trabalhos ou solicitações de cliente, mesmo que o estado do nó seja Online.

Durante as operações normais, os nós têm um valor de integridade do nó de OK. A lista a seguir descreve os valores de estado do nó normal:

  • O nó principal tem um valor de estado de nó de offline. Se o nó principal também estiver atuando como um nó de computação ou um nó de agente do WCF ou se um nó de cabeçalho estiver instalado para alta disponibilidade, o valor de estado do nó normal será Online.

  • Nós de computação e nós de agente do WCF (Windows Communication Foundation) têm um valor de estado de nó de Online.

  • Nós de estação de trabalho podem ter um valor de estado de nó de online ou offline, de acordo com a política de disponibilidade.

  • Os nós do Windows Azure definidos, mas não implantados no Windows Azure, têm um valor de estado de nó normal de Não Implantado. Os nós do Windows Azure implantados têm um valor de estado de nó normal de Online.

Parte do processo de monitoramento e manutenção da integridade do cluster é encontrar desvios do estado e da integridade do nó normal e monitorar o estado das operações de cluster.

As seções neste tópico descrevem os valores para:

Estados do nó

Os estados do nó refletem o estado de implantação de um nó e se um administrador deseja ou não que o nó esteja disponível como um recurso para trabalhos de cluster.

Quando o nó principal detecta pela primeira vez um nó local na rede, o nó aparece no estado Desconhecido. Quando um administrador adiciona um nó ao cluster atribuindo um modelo de nó, o nó é movido para o estado de Provisionamento de . Quando o nó ingressou com êxito no cluster, ele se move para o estado offline .

Quando um administrador adiciona nós do Windows Azure ao cluster, eles aparecem no estado Não Implantado. Quando os nós do Windows Azure são iniciados (o que significa que as instâncias são implantadas no Windows Azure), os nós se movem para o estado Provisionamento. Após a conclusão do provisionamento com êxito, um nó do Windows Azure iniciado manualmente vai para o estado de offline e um nó do Windows Azure iniciado automaticamente vai para o estado do Online.

Quando um administrador adiciona nós de estação de trabalho e nós de servidor não gerenciados ao cluster e, depois que o modelo de nó é atribuído, ele pode ser colocado online para executar trabalhos de cluster e, em seguida, colocado offline para retomar suas cargas de trabalho normais. Os nós configurados no modelo de nó a serem colocados online e offline manualmente serão inicialmente offline. Os nós configurados para serem colocados online e offline de acordo com uma política de disponibilidade semanal começarão a seguir essa política e serão colocados online automaticamente durante os intervalos agendados.

Um administrador traz um nó Online ou usa um nó offline para indicar se os nós devem ou não aceitar e executar trabalhos de cluster. Nós do Windows Azure e Nós de Estação de Trabalho também podem ser trazidos online ou offline de acordo com uma política de disponibilidade semanal. O Serviço de Agendador de Trabalho do HPC tentará iniciar apenas novos trabalhos em nós que estão no estado do Online. Para tornar um nó indisponível para novos trabalhos, os administradores podem usar o nó offline. Os nós devem estar no estado offline para executar algumas ações de gerenciamento, como de Imagem Nova ou Manter.

Você pode usar a exibição de lista de nós para exibir o estado de cada nó e filtrar nós de computação por estado do nó.

A tabela a seguir descreve os valores de estado do nó:

Estado do nó Descrição
Online Esse estado indica que o nó deve aceitar e executar trabalhos de cluster. Para nós do Agente do WCF, esse estado indica que eles devem estar disponíveis para gerenciar sessões SOA. O Serviço de Agendador de Trabalho do HPC tentará apenas alocar trabalho para nós que estão no estado Online.

Um nó deve estar no online estado do nó e íntegro para executar trabalhos (ou gerenciar sessões). Se a integridade do nó for Erro, os trabalhos não poderão iniciar nesse nó.

Nós podem ser trazidos online ou offline pelo administrador do cluster. Nós do Windows Azure, nós de estação de trabalho e nós de servidor não gerenciados também podem ser trazidos online ou offline de acordo com uma política de disponibilidade semanal.
offline Esse estado indica que o nó não deve ser usado para executar trabalhos de cluster. Para nós do WCF Broker, isso indica que ele não deve ser usado para gerenciar sessões SOA. Esse estado permite que um administrador de cluster execute scripts, instale software e execute outras tarefas no nó. Esse é o estado padrão de um nó depois que um administrador de cluster aprovou o nó para inclusão no cluster.

Esse é o estado normal para um nó de cabeçalho (a menos que esteja instalado para alta disponibilidade). Você pode trazer um nó de cabeçalho Online se quiser que ele execute funções de nó adicionais, como Nó de Computação ou Nó do Agente do WCF. Para obter mais informações, consulte Noções básicas sobre funções de nó no Microsoft HPC Pack.

Nós podem ser trazidos online ou offline pelo administrador do cluster. Nós do Windows Azure, nós de estação de trabalho e nós de servidor não gerenciados também podem ser trazidos online ou offline de acordo com uma política de disponibilidade semanal.

Se um nó for colocado offline durante a execução de trabalhos, ele passará pela estado de de drenagem. Se um administrador optar por forçar o nó offline imediatamente, todas as tarefas em execução serão canceladas e requeuídas em seu trabalho.
Desconhecido Esse estado indica que o nó não faz parte do cluster ou que uma operação de provisionamento falhou nesse nó.

Para unir um nó ao cluster, aplique a ação Atribuir Modelo de Nó ao nó.

Em um cluster de alta disponibilidade, após a instalação ser executada no primeiro nó principal, o segundo nó principal estará no estado Desconhecido até que a instalação seja executada nesse nó. Após a instalação, o segundo nó principal passa para o estado de do Online.
provisionamento Nós locais

Esse estado indica que o nó está sendo configurado como um nó de cluster. As açõesatribuir modelo de nó , de Imagem Nova e Manter também colocam um nó no estado de provisionamento. Depois que o provisionamento for concluído, o nó irá para o estado offline .

Nós do Windows Azure

Esse estado indica que a instância do nó está sendo implantada no Windows Azure. O iniciar ação ou uma política de disponibilidade automática pode colocar um nó do Windows Azure no estado de provisionamento. Após a conclusão do provisionamento com êxito, um Nó do Windows Azure iniciado manualmente vai para o estado de
offline e um nó do Windows Azure iniciado automaticamente vai para o estado do Online.
iniciando Esse estado indica que o nó está fazendo a transição do modo de offline do para o modo de do Online. Observação: a ação iniciar do não coloca nós no estado de Inicial . A ação Iniciar aplica-se somente aos nós do Windows Azure e é usada para implantar instâncias de nó no Windows Azure. Quando a ação Iniciar for aplicada, os nós entrarão no estado de Provisionamento .
de drenagem Esse estado indica que o nó foi colocado offline e está fazendo a transição para o estado de offline . O nó conclui os trabalhos em execução no momento antes de ir para o estado offline. nós de de drenagem não aceitam novos trabalhos.
removendo Esse estado indica que as informações sobre o nó estão sendo removidas do banco de dados dos Serviços de Gerenciamento de Nós do HPC. A ação Excluir coloca um nó nesse estado. Nada é alterado no próprio nó excluído.

Se o nó tentar reencontrar o cluster, uma nova entrada será criada para esse nó no banco de dados e o nó aparecerá no estado Desconhecido.
rejeitado Esse estado indica que o nó foi rejeitado por um administrador de cluster.
não implantado Esse estado só se aplica aos nós do Windows Azure.

Esse estado indica que o nó do Windows Azure foi definido e adicionado ao cluster, mas o nó não foi iniciado e provisionado no Windows Azure (a instância do nó não foi criada no Windows Azure). Os nós do Windows Azure são implantados de acordo com a política de disponibilidade definida no modelo de nó: manualmente (com o iniciar ação) ou automaticamente com base em um agendamento semanal.

Nós do Windows Azure no estado não implantado não incorrem em encargos no Windows Azure.
parar Esse estado só se aplica aos nós do Windows Azure.

Esse estado indica que a instância do nó do Windows Azure está sendo removida do Windows Azure. Os nós do Windows Azure são interrompidos de acordo com a política de disponibilidade definida no modelo de nó: manualmente (com a ação Parar ) ou automaticamente com base em um agendamento semanal.

Quando as operações de parada são concluídas (a instância do nó é removida do Windows Azure), o nó vai para o estado
não implantado.

Integridade do nó

de Integridade do Nó indica se há ou não avisos ou erros que os serviços de HPC estão cientes nesse nó.

Você pode usar a exibição de lista de nós para exibir a integridade de cada nó de computação e filtrar nós por integridade do nó. Se a integridade do nó estiver de erro ou de aviso, examine as informações na guia de Integridade do Nó para obter detalhes adicionais. Você pode exibir a guia de Integridade do Nó no Painel de Detalhes do (no modo de exibição de lista) ou clicando duas vezes em um nó.

A tabela a seguir descreve os valores de integridade do nó:

Integridade do nó Descrição
OK Os serviços de HPC não estão cientes de nenhum problema com o nó.
de aviso Esse valor pode indicar o seguinte:

- Um administrador de cluster executou testes de diagnóstico no nó e um ou mais testes retornaram um resultado de falha ou falha ao executar. Um administrador pode limpar manualmente os alertas de diagnóstico (consulte Resolver e limpar alertas de diagnóstico).
- Uma ou mais operações de nó estão nocom falha , Revertido ou estado de Cancelado. ler o log de operações para investigar o problema.

Examine as informações na guia
de Integridade do Nó do para começar a investigar o problema.
de erro do Esse valor pode indicar o seguinte:

- O nó não é acessível, conforme determinado pelas opções de pulsação .
- Falha no provisionamento.
- O nó foi rejeitado por um administrador de cluster. (Você pode atribuir um modelo de nó se decidir unir o nó ao cluster.)

Examine as informações na guia de Integridade do Nó do para começar a investigar o problema.
transitório Esse valor indica que o nó está executando uma operação iniciada por um administrador de cluster, como:

- atribuirde modelo de nó, de imagem nova ou manter (nesse caso, o Estado do Nó está Provisionamento).
- Bring Online (nesse caso, o estado do nó está inicial).
- Offline (nesse caso, o Estado do Nó está de Drenagem).
- iniciar para nós do Windows Azure (nesse caso, o Estado do Nó está de Provisionamento).

Exiba a guia de Integridade do Nó para obter informações adicionais ou cancelar a operação.
não aprovado Nós locais

O nó foi detectado pelo nó principal, mas não faz parte do cluster. Atribua um modelo de nó para unir o nó ao cluster. Consulte também Adicionar nós a um cluster.

Nós do Windows Azure

O nó foi adicionado ao cluster, mas o nó não foi iniciado e provisionado no Windows Azure (a instância do nó não existe no Windows Azure).

Estados de operação

Para obter informações sobre como exibir o log de operações, consulte Ler o log de operações.

A tabela a seguir descreve os valores de estado da operação:

Estado da operação Descrição
arquivados A operação tem mais de 24 horas ou o teste de diagnóstico foi limpo. Quando uma operação é arquivada, ela é removida de outros relatórios de status.
confirmado A operação foi concluída com êxito.
executando A operação está em andamento.
falha na Falha na execução da operação.
revertendo A operação está sendo revertida. Quando a limpeza da operação for concluída, a operação será movida para o estado de Revertido.
falha ao reverter A limpeza da operação não foi bem-sucedida.
revertida A operação foi revertida após falha ou cancelamento.

Referências adicionais