Диагностика отказоустойчивого кластера
Этот подраздел содержит следующие сведения:
основные шаги диагностики;
восстановление по журналу после сбоя отказоустойчивого кластера;
разрешение наиболее частых проблем отказоустойчивого кластера;
использование расширенных хранимых процедур и объектов COM.
Основные шаги диагностики
При работе с отказоустойчивым кластером SQL Server помните, что кластер серверов состоит из экземпляра отказоустойчивого кластера, работающего под управлением службы кластеров (Майкрософт) (MSCS). Этот экземпляр SQL Server может размещаться на узлах Microsoft MSCS, составляющих кластер серверов Майкрософт.
Если на узлах кластера серверов возникнут проблемы, это может свидетельствовать о проблемах экземпляра отказоустойчивого кластера. Для идентификации и разрешения этих проблем отказоустойчивого кластера SQL Server необходимо предпринять следующие действия.
Оборудование: просмотрите журналы системных событий Microsoft Windows.
Операционная система: просмотрите журналы событий системы и приложений Windows.
Сеть: просмотрите журналы событий системы и приложений Windows. Проверьте текущую конфигурацию по статье базы знаний, посвященной рекомендуемой частной конфигурации с тактовым импульсом для серверов в кластере.
Безопасность. просмотрите журналы событий приложений и безопасности Windows.
MSCS: просмотрите журнал событий системы Windows, журнал приложений и журнал кластера.
SQL Server: Устраните ошибки обычным способом после установления отсутствия ошибок с оборудованием, ОС, сетью, безопасностью и MSCS.
Восстановление по журналу после сбоя отказоустойчивого кластера
Обычно сбой отказоустойчивого кластера возникает в следующих случаях.
Сбой оборудования в одном из узлов двухузлового кластера. Такой сбой оборудования может быть вызван сбоем SCSI-контроллера или ОС.
Для восстановления после такого сбоя удалите неисправный узел из отказоустойчивого кластера с помощью программы установки SQL Server, устраните сбой оборудования, переключив компьютер в автономный режим, восстановите машину и добавьте восстановленный узел снова к экземпляру отказоустойчивого кластера.
Дополнительные сведения см. в разделах Как создать новый отказоустойчивый кластер SQL Server (программа установки) и Как произвести восстановление после сбоя отказоустойчивого кластера в сценарии 1.
Ошибка операционной системы. В этом случае данный узел отключен, но не является окончательно неисправным.
Для восстановления после сбоя ОС восстановите данный узел и проверьте переход на другой ресурс. Если данный экземпляр SQL Server не переключается на другой ресурс должным образом, необходимо программой установки SQL Server удалить SQL Server из отказоустойчивого кластера, произвести необходимые восстановительные процедуры, восстановить резервную копию и снова добавить восстановленный узел к экземпляру отказоустойчивого кластера.
Восстановление по журналу после сбоя ОС может занять значительное время. Если восстановить ОС после сбоя можно более простым способом, не прибегайте к этому методу.
Дополнительные сведения см. в разделах Как создать новый отказоустойчивый кластер SQL Server (программа установки) и Как произвести восстановление после сбоя отказоустойчивого кластера в сценарии 2.
Разрешение общих проблем
В следующем списке приведено описание общих проблем и даны объяснения по их устранению.
Проблема. неверное использование синтаксиса командной строки при установке SQL Server
Причина 1. Диагностировать проблемы программы установки при использовании в командной строке параметра /qn трудно, поскольку параметр /qn подавляет все диалоговые окна программы установки и сообщения об ошибках. Если указан параметр /qn, все сообщения программы установки, включая сообщения об ошибках, записываются в файлы журналов программы установки. Дополнительные сведения о файлах журналов см. в разделе Как просмотреть и прочитать файлы журналов установки SQL Server.
Решение 1. Вместо параметра /qn используйте параметр /qb. При использовании параметра /qb на каждом шаге отображается интерфейс пользователя, в том числе сообщения об ошибках.
Проблема. SQL Server не удается подключиться к сети после его перемещения на другой узел
**Причина 1.**SQL Server Учетная запись службы не может связаться с контроллером домена.
Решение 1. Проверьте журналы событий на наличие записей о проблемах сети, например о сбоях адаптеров или проблемах с DNS. Проверьте контроллер домена командой ping.
Причина 2. Пароли учетной записи службы SQL Server отличаются на разных узлах кластера, или узел не перезапускает службу SQL Server, которая была перенесена с неисправного узла.
Решение 2. Измените пароли учетной записи службы SQL Server при помощи диспетчера конфигурации SQL Server. Если это не было сделано, а пароли учетной записи службы SQL Server изменены на одном узле, необходимо также изменить их на всех остальных узлах. Диспетчер конфигурации SQL Server выполняет это автоматически.
Проблема. SQL Server не может получить доступ к дискам кластера
Причина 1. Программы ПЗУ или драйверы обновлены не на всех узлах.
Решение 1. Проверьте, что на всех узлах установлены правильные версии программ ПЗУ и одинаковые версии драйверов.
Причина 2. Узел не может восстановить диски кластера, перенесенные с неисправного узла на общий диск кластера с другой буквой диска.
Решение 2. Буквы для дисков кластера должны совпадать на обоих серверах. Если это не так, проверьте исходную установку ОС и службы кластеров (Майкрософт) (MSCS).
Проблема: сбой службы SQL Server вызывает переход на другой ресурс
Решение. Чтобы сбой определенных служб не вызывал перехода группы SQL Server на другой ресурс, настройте эти службы при помощи программы администрирования кластеров Windows следующим образом.
- Сбросьте флажок Применить к группе на вкладке Дополнительно диалогового окна Свойства полного текста. Однако, если SQL Server вызовет переход на другой ресурс, служба полнотекстового поиска будет перезапущена.
Проблема: SQL Server не запускается автоматически
Решение. При помощи администратора кластеров настройте автоматический запуск отказоустойчивого кластера. Не следует настраивать службу SQL Server для запуска вручную, нужно настроить приложение «Администратор кластеров» в MSCS для запуска службы SQL Server. Дополнительные сведения см. в разделе Управление службами.
Проблема: сетевой ресурс, к которому выполняется обращение по имени, недоступен, и нельзя подключиться к SQL Server по протоколу TCP/IP
Причина 1. Сбой службы DNS, в то время как ресурсы кластера настроены на использование DNS.
Решение 1. Устраните проблемы с DNS.
Причина 2. Повторяющееся имя в сети.
Решение 2. С помощью программы NBSTAT найдите повторяющееся имя и устраните проблему.
**Причина 3.**SQL Server Не удается соединиться с с использованием именованных каналов.
Решение 3. Для подключения через именованные каналы создайте псевдоним при помощи диспетчера конфигурации SQL Server для подключения к нужному компьютеру. Например, при использовании кластера с двумя узлами (Узел A и Узел B) и экземпляра отказоустойчивого кластера (Virtsql) с экземпляром по умолчанию подключиться к серверу, ресурс сетевого имени которого недоступен, можно, выполнив следующие шаги.
При помощи администратора кластеров определите, на каком узле группы запущен экземпляр SQL Server. Например, это Узел A.
Запустите службу SQL Server на этом компьютере с помощью команды net start. Дополнительные сведения об использовании команды net start см. в разделе Запуск SQL Server вручную.
Запустите диспетчер конфигурации SQL Server на Узле A. Просмотрите именованный канал, по которому прослушивает этот сервер. Название будет похоже на \\.\$$\VIRTSQL\pipe\sql\query.
На клиентском компьютере запустите диспетчер конфигурации SQL Server.
Создайте псевдоним SQLTEST1 для соединения с этим каналом по протоколу именованных каналов. Для этого введите Узел A в качестве имени сервера и измените имя канала на «\\.\pipe\$$\VIRTSQL\sql\query».
Подключитесь к экземпляру сервера с использованием псевдонима SQLTEST1 в качестве имени сервера.
Проблема. программа установки SQL Server на кластере завершилась с кодом ошибки 11001
Причина. Потерян раздел реестра в ветке [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL.X\Cluster].
Решение. Удостоверьтесь, что куст реестра MSSQL.X в настоящее время не используется, и удалите данный ключ кластера.
Проблема. ошибка при установке кластера: «У установщика недостаточно прав доступа к каталогу: <диск>\Microsoft SQL Server Невозможно продолжить установку. Войдите в систему как администратор или обратитесь к системному администратору»
Причина. Эта ошибка произошла из-за неправильного разбиения на разделы общего диска SCSI.
Решение. Создайте повторно один раздел на этом общем диске, выполнив следующие шаги.
Удалите данный дисковый ресурс из кластера.
Удалите на этом диске все разделы.
Проверьте в свойствах диска, что он является основным.
Создайте на этом общем диске один раздел, отформатируйте диск и присвойте ему букву.
Добавьте этот диск к кластеру с помощью администратора кластеров (cluadmin).
Запустите программу установки SQL Server.
Проблема. приложениям не удается прикрепить ресурсы SQL Server в распределенной транзакции
Причина. Поскольку координатор распределенных транзакций (Майкрософт) (MS DTC) настроен в Windows не полностью, то приложениям, возможно, не удастся прикрепить ресурсы SQL Server к распределенной транзакции. Эта проблема касается связанных серверов, распределенных запросов и удаленных хранимых процедур, использующих распределенные транзакции. Дополнительные сведения о настройке MS DTC см. в разделе Подготовка к установке отказоустойчивого кластера.
Решение. Для предотвращения этой проблемы необходимо полностью включить службы MS DTC на серверах, на которых установлен SQL Server и настроен MS DTC.
Для полного включения служб MS DTC выполните следующие шаги.
На панели управления откройте Администрирование, затем Управление компьютером.
В левой области окна «Управление компьютером» раскройте Службы и приложения и щелкните Службы.
В правой области окна «Управление компьютером» щелкните правой кнопкой мыши Координатор распределенных транзакций и выберите Свойства.
В окне Координатор распределенных транзакций перейдите на вкладку Общие и нажмите кнопку Стоп, чтобы остановить службы.
В окне Координатор распределенных транзакций перейдите на вкладку Вход в систему и выберите в качестве учетной записи входа NT AUTHORITY\NetworkService.
Нажмите кнопки Применить и ОК, чтобы закрыть окно Координатор распределенных транзакций. Закройте окно Управление компьютером. Закройте окно Администрирование.
Использование расширенных хранимых процедур и объектов COM
При использовании расширенных хранимых процедур в конфигурациях с отказоустойчивым кластером все такие процедуры должны быть установлены на диск кластера под управлением SQL Server. Это обеспечивает возможность использования расширенных хранимых процедур после перехода узла на другой ресурс.
Если эти расширенные хранимые процедуры используют компоненты COM, администратор должен зарегистрировать эти компоненты на каждом узле кластера. Чтобы компоненты COM можно было создать, сведения для их загрузки и выполнения должны содержаться в реестре активного узла. Иначе эти сведения содержатся в реестре компьютера, на котором эти компоненты COM были зарегистрированы в первый раз.