Определение сбоя узла кластера для системы платформы аналитики
В этой статье описывается, как определить имя узла системы платформы аналитики (PDW), который произошел сбой после отработки отказа кластера, и возникло оповещение об отработки отказа кластера. В рамках устранения неполадок при отработки отказа кластера необходимо определить имя узла, который завершился сбоем перед обращением к корпорации Майкрософт, чтобы устранить проблему.
Общие сведения
Для обеспечения высокой доступности в SQL Server PDW узел управления и вычислительные узлы настраиваются как активные или пассивные компоненты отказоустойчивых кластеров Windows. Если активный сервер не отвечает на критические системные запросы, пассивный сервер выполняет отработку отказа и выполняет функции сервера, который завершился сбоем.
После отработки отказа кластера, когда SQL Server PDW сообщает о состоянии узла, пассивный сервер имеет состояние отработки отказа. Тем не менее, не очевидно, какой сервер или узел завершился сбоем, особенно если сервер, который завершился сбоем, по-прежнему находится в сети. Чтобы устранить сбой кластера, необходимо определить имя узла, который завершил отработку отказа.
решение консоли Администратор
Найдите имя узла, который завершился сбоем
- Откройте консоль Администратор. Дополнительные сведения о консоли Администратор см. в статье "Мониторинг устройства с помощью консоли Администратор (система платформы аналитики)". После отработки отказа событие отработки отказа включается в число оповещений на странице РАБОТОСПОСОБНОСТИ . Существует страница HEALTH для региона PDW и области структуры (модуль). На каждой странице работоспособности есть вкладка ALERTS . Чтобы узнать больше об оповещении, выберите страницу работоспособности, вкладку "Оповещения" и выберите оповещение.
Решение для системного представления
В следующей инструкции SQL показано, как использовать системное представление sys.dm_pdw_component_health_active_alerts для поиска имени сервера, который завершился сбоем.
SELECT
SUBSTRING( component_instance_id, 2, charindex(' ', component_instance_id, 1)-2) AS failed_node_name,
create_time AS failover_time
FROM sys.dm_pdw_component_health_active_alerts
WHERE alert_id = 500139
ORDER BY failed_node_name;