Руководство по устранению неполадок, связанных со сбоем при запуске службы кластеров

Статья
01/15/2025

Контрольный список по устранению неполадок

Проверьте используемые порты службы кластеров

Во всех брандмауэрах должны быть открыты следующие порты для кластерного трафика:

Порт 135. Сопоставление конечных точек удаленного вызова процедур (RPC) или распределенная объектная модель компонента (DCOM).
Порт 135: схема конечной точки RPC по протоколу пользовательской диаграммы данных (UDP).
Порт 3343: сетевой драйвер кластера.
Порт 445: блок сообщений сервера (SMB).
Порт 139: служба сеансов NetBIOS.
Порты в диапазоне от 5000 до 5099: если при подключении к кластеру в качестве администратора кластера регистрируется идентификатор события 1721, попробуйте открыть порты в этом диапазоне (или других портах) для трафика RPC. Порты поддерживают обмен данными через RPC, если только вы не вводите символ периода (.).

Эта проблема может возникнуть, так как служба кластера использует по крайней мере 100 портов для связи RPC. Количество портов, доступных службе кластера, может стать слишком небольшим, если другие службы используют некоторые необходимые порты. Эти службы могут включать службу Windows DNS, службу имен Интернета Windows (WINS) или службу Microsoft SQL Server.
Порты в диапазоне от 8011 до 8031: если брандмауэры отделяют узлы кластера, порты в диапазоне от 8011 до 8031 должны быть открыты для трафика RPC. В противном случае ошибки в журнале кластера указывают на то, что узел спонсора недоступен. Эти ошибки возникают из-за нехватки портов, доступных для связи RPC между узлом, который пытается присоединиться к кластеру и узлу, который может спонсировать этот узел.

Дополнительные сведения о настройке сетевых и сетевых портов для кластера см. в следующих статьях:

После изменения параметров порта повторите попытку повторного подключения узла к сети, прежде чем продолжить работу.

Запуск средства проверки кластеров

Откройте оснастку диспетчера отказоустойчивых кластеров (CluAdmin.msc).
Выберите диспетчер отказоустойчивости кластеров в верхнем левом столбце.
Выберите " Проверить конфигурацию".
Введите имя каждого узла в кластере и нажмите кнопку "Добавить " после каждого из них.
Когда все узлы были добавлены на выбранные серверы: список, нажмите кнопку "Далее".
Нажмите кнопку "Выполнить все тесты" (рекомендуется)>Далее.>
Разрешить завершению теста. После завершения выберите "Просмотреть отчет".
Просмотрите все результаты тестов, помеченные как сбой или предупреждение. Эти сведения могут помочь выполнить действия для устранения проблемы.
Чтобы получить скачиваемый файл, перейдите в папку C:\Windows\Cluster\Reports и откройте отчет проверки (). MHT) файл.

Примечание.

В Windows Server 2016 и более поздних версиях это файл .HTM .

Проверьте возможное действие политик безопасности на узел кластера

В редакторе объектов групповой политики эти объекты политики находятся в разделе "Конфигурация компьютера\Параметры Windows\Параметры безопасности\Локальные политики\Назначение прав пользователя".

Примечание.

Чтобы получить доступ к параметрам локальной политики безопасности, нажмите кнопку "Пуск", введите локальную политику безопасности и выберите "Локальная политика безопасности".

Проверьте, что список учетных записей включает записи, ответственные за работу узла кластера. Дополнительные сведения см. в статье "Как получить доступ к этому компьютеру из сети и разрешить вход в локальной политике безопасности".
Убедитесь, что список учетных записей не включает локальные учетные записи. Дополнительные сведения см. в разделе "Как запретить доступ к этому компьютеру из сети".
Убедитесь, что список учетных записей и групп не включает группу "Все". Дополнительные сведения см. в разделе "Запрет входа в локальной политике безопасности".

После изменения параметров политики повторите попытку повторного подключения узла к сети, прежде чем продолжить работу.

Временно отключите брандмауэры

Отключите брандмауэр между узлом и остальной частью кластера, а затем попробуйте подключить узел повторно. Если узел по-прежнему не подключен, брандмауэр может быть причиной.

Внимание

Не оставляйте это изменение на месте после завершения устранения неполадок. После использования этого изменения для тестирования верните эти параметры в исходную конфигурацию.

Проверьте наличие проблем с сетевым оборудованием и программным обеспечением

Проверьте журнал событий системы для ошибок оборудования или программного обеспечения, связанных с сетевыми адаптерами на этом узле.
Проверьте сетевой адаптер, кабели и конфигурацию для сетей, соединяющих узлы.
Если вы объединяете сетевые адаптеры, убедитесь, что конфигурация группирования правильна.
Проверьте концентраторы, коммутаторы и мосты в сетях, соединяющих узлы.

Просмотр файлов журнала

Чтобы определить источник проблемы, просмотрите сведения журнала из нескольких источников. Например:

В Просмотр событий перейдите к журналам приложений и служб\Microsoft\Windows\FailoverClustering-Client\Diagnostic и просмотрите журналы трассировки отладки API кластера.
Создайте новый журнал кластера для узла. На сервере, на котором запущен затронутый узел, откройте запрос PowerShell с повышенными привилегиями и выполните следующий командлет:

Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Чтобы создать более подробную трассировку, выполните следующие действия.

В командной строке PowerShell с повышенными привилегиями выполните следующий командлет, чтобы запустить трассировку:

logman create trace "base_cluster" -ow -o c:\base_cluster.etl -p "Microsoft-Windows-FailoverClustering-Client" 0xffffffffffffffff 0xff -nb 16 16 -bs 1024 -mode Circular -f bincirc -max 4096 -ets
Воспроизведите проблему.
Чтобы остановить трассировку, выполните следующий командлет:

Logman stop base_cluster.etl -ets
Чтобы преобразовать трассировку, выполните следующий командлет:

Netsh trace convert base_cluster.etl
Чтобы создать журнал кластера из данных, выполните следующий командлет:

Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Дополнительные сведения о трассировке и других проблемах для поиска см. в разделе "Устранение неполадок при создании отказоустойчивых кластеров".

Поделиться через