Compartir vía


Determinar en qué nodo de clúster se ha producido un error para Analytics Platform System

En este artículo se describe cómo determinar el nombre del nodo de Analytics Platform System (PDW) en el que se ha producido un error después de una migración tras error de clúster y de que se haya generado una alerta de migración tras error de clúster. Como parte de la solución de problemas de una conmutación por error de clúster, debe determinar el nombre del nodo en el que se ha producido un error antes de ponerse en contacto con Microsoft para ayudar a resolver el problema.

Fondo

Para lograr alta disponibilidad en PDW de SQL Server, el nodo de control y los nodos de ejecución se configuran como componentes activos o pasivos de clústeres de conmutación por error de Windows. Cuando un servidor activo no responde a las solicitudes críticas del sistema, el servidor pasivo conmuta por error y realiza las funciones del servidor en el que se ha producido el error.

Después de una conmutación por error de clúster, cuando PDW de SQL Server notifica el estado del nodo, el servidor pasivo tiene un estado de conmutación por error. Pero no es evidente en qué servidor o nodo se producido un error, especialmente si el servidor en el que se producido todavía está en línea. Para solucionar el error del clúster, debe determinar el nombre del nodo que se ha conmutado por error.

Solución de la consola de administración

Búsqueda del nombre del nodo en el que se ha producido un error

  1. Abra la consola de administración. Para más información sobre la consola de administración, vea Supervisión del dispositivo mediante la consola de administración (Analytics Platform System). Una vez que se produce la conmutación por error, el evento de conmutación por error se incluye en el número de alertas de la página HEALTH. Hay una página HEALTH para la región de PDW y para la región del tejido del dispositivo. Cada página Estado tiene una pestaña ALERTAS. Para obtener más información sobre una alerta, seleccione la página Estado, luego la pestaña Alertas y, después, seleccione una alerta.

Solución de vistas del sistema

La siguiente instrucción SQL muestra cómo usar la vista del sistema sys.dm_pdw_component_health_active_alerts para buscar el nombre del servidor que en el que se ha producido un error.

SELECT  
SUBSTRING( component_instance_id, 2, charindex(' ', component_instance_id, 1)-2) AS failed_node_name,  
create_time AS failover_time  
FROM sys.dm_pdw_component_health_active_alerts  
WHERE alert_id = 500139  
ORDER BY failed_node_name;