Determinar qual nó de cluster falhou para o Analytics Platform System
Este artigo descreve como determinar o nome do nó do Analytics Platform System (PDW) que falhou depois que um failover de cluster ocorreu e um alerta de failover de cluster foi gerado. Como parte da solução de problemas de failover de cluster, você deve determinar o nome do nó que falhou, antes de entrar em contato com a Microsoft para ajudar a resolver o problema.
Tela de fundo
Para alta disponibilidade no SQL Server PDW, o nó de controle e os nós de computação são configurados como componentes ativos ou passivos de clusters de failover do Windows. Quando um servidor ativo não responde a solicitações críticas do sistema, o servidor passivo faz failover e executa as funções do servidor que falhou.
Depois de um failover de cluster, quando o SQL Server PDW relata o status do nó, o servidor passivo tem um status de failover. No entanto, não é óbvio qual servidor ou nó falhou, especialmente se o servidor que falhou ainda estiver online. Para solucionar a falha de cluster, você deve determinar o nome do nó que fez failover.
Solução do console de administração
Localizar o nome do nó que falhou
- Abra o Console de Administração. Para obter mais informações sobre o Console de Administração, consulte Monitorar o dispositivo usando o console do administrador (Analytics Platform System). Depois que o failover ocorre, o evento de failover é incluído no número de alertas na página INTEGRIDADE . Há uma página INTEGRIDADE para a região PDW e para a região de malha do dispositivo. Cada página de Integridade tem uma guia ALERTAS. Para saber mais sobre um alerta, selecione a página Integridade na guia Alertas e escolha um alerta.
Solução da exibição do sistema
A instrução SQL a seguir mostra como usar a exibição do sistema sys.dm_pdw_component_health_active_alerts para localizar o nome do servidor que falhou.
SELECT
SUBSTRING( component_instance_id, 2, charindex(' ', component_instance_id, 1)-2) AS failed_node_name,
create_time AS failover_time
FROM sys.dm_pdw_component_health_active_alerts
WHERE alert_id = 500139
ORDER BY failed_node_name;