Общие сведения о состояниях узлов, работоспособности и операциях
состояние узла отражает состояние развертывания узла, а администратор хочет, чтобы узел был доступен в качестве ресурса для заданий кластера. Администратор переносит узел в состояние Online, чтобы указать, что узел должен принимать задания или клиентские запросы.
работоспособность узла указывает, существуют ли предупреждения или ошибки, о которых знают службы HPC на этом узле. Если узел имеет значение работоспособности
Во время обычных операций узлы имеют значение работоспособности узла OK. В следующем списке описываются обычные значения состояния узла:
Головной узел имеет значение состояния узла автономный. Если головной узел также выступает в качестве вычислительного узла или узла брокера WCF, либо если головной узел установлен для обеспечения высокой доступности, то его нормальное состояние узла равно Online.
Вычислительные узлы и узлы брокера Windows Communication Foundation (WCF) имеют значение состояния узла Online.
Узлы рабочей станции могут иметь значение состояния узла Online или автономныхв соответствии с политикой доступности.
Узлы Windows Azure, определенные, но не развернутые в Windows Azure, имеют обычное состояние узла не развернутые. Развернутые узлы Windows Azure имеют обычное значение состояния узла Online.
Часть процесса мониторинга и поддержания работоспособности кластера заключается в поиске отклонений от нормального состояния узла и работоспособности и мониторинга состояния операций кластера.
В разделах этого раздела описываются значения для следующих значений:
Состояния узла
Состояния узлов отражают состояние развертывания узла и хотят ли администратор, чтобы узел был доступен в качестве ресурса для заданий кластера.
Когда головной узел сначала обнаруживает локальный узел в сети, узел отображается в состоянии Неизвестное. Когда администратор добавляет узел в кластер, назначив шаблон узла, узел перемещается в состояние подготовки. Когда узел успешно присоединился к кластеру, он перемещается в состояние автономного.
Когда администратор добавляет узлы Windows Azure в кластер, они отображаются в состоянии не развернутые. При запуске узлов Windows Azure (это означает, что экземпляры развертываются в Windows Azure), узлы перемещаются в состояние подготовки. После успешной подготовки узел Windows Azure, который запускается вручную, переходит в состояние автономного, а узел Windows Azure, запущенный автоматически, переходит в состояние Online.
Когда администратор добавляет узлы рабочих станций и неуправляемые узлы сервера в кластер, а после назначения шаблона узла они могут быть подключены для запуска заданий кластера, а затем отключаются для возобновления обычных рабочих нагрузок. Узлы, настроенные в шаблоне узла, которые будут переданы в режим "в сети" и "автономный" вручную, изначально будут отключены. Узлы, настроенные для подключения к сети и автономные в соответствии с еженедельной политикой доступности, начнут следовать этой политике, и они будут автоматически доставлены в режим "в сети" во время запланированных интервалов.
Администратор приносит узел Online или принимает узел автономных, чтобы указать, должны ли узлы принимать и запускать задания кластера. Узлы Windows Azure и узлы рабочей станции также могут быть доставлены Online или автономных в соответствии с еженедельной политикой доступности. Служба планировщика заданий HPC попытается запустить новые задания только на узлах, которые находятся в состоянии Online. Чтобы сделать узел недоступным для новых заданий, администраторы могут принять узел автономных. Узлы должны находиться в состоянии автономного
Представление списка узлов можно использовать для отображения состояния каждого узла и фильтрации вычислительных узлов по состоянию узла.
В следующей таблице описываются значения состояния узла:
Состояние узла | Описание |
---|---|
Online | Это состояние указывает, что узел должен принимать и запускать задания кластера. Для узлов брокера WCF это состояние указывает, что они должны быть доступны для управления сеансами SOA. Служба планировщика заданий HPC попытается выделить работу только узлам, которые находятся в состоянии Online. Узел должен находиться в состоянии узла Online и работоспособным для выполнения заданий (или управления сеансами). Если работоспособность узла ошибка, задания не смогут запускаться на этом узле. Узлы могут быть переданы Online или автономных администратором кластера. Узлы Windows Azure, узлы рабочих станций и неуправляемые узлы сервера также могут быть доставлены Online или автономных в соответствии с еженедельной политикой доступности. |
автономных | Это состояние указывает, что узел не должен использоваться для запуска заданий кластера. Для узлов брокера WCF это означает, что он не должен использоваться для управления сеансами SOA. Это состояние позволяет администратору кластера запускать сценарии, устанавливать программное обеспечение и выполнять другие задачи на узле. Это состояние узла по умолчанию после того, как администратор кластера одобрил узел для включения в кластер. Это нормальное состояние головного узла (если он не установлен для обеспечения высокой доступности). Вы можете принести головной узел Online, если вы хотите, чтобы он выполнял дополнительные роли узла, например вычислительный узел или узел брокера WCF. Дополнительные сведения см. в статье Основные сведения о ролях узлов в пакете Microsoft HPC. Узлы могут быть переданы Online или автономных администратором кластера. Узлы Windows Azure, узлы рабочих станций и неуправляемые узлы сервера также могут быть доставлены Online или автономных в соответствии с еженедельной политикой доступности. Если узел отключается во время выполнения заданий, сначала перемещается через состояние очистки. Если администратор решит немедленно отключить узел, все выполняемые задачи будут отменены и повторно перезапугированы в рамках своего задания. |
Неизвестное | Это состояние указывает, что узел не является частью кластера или что операция подготовки завершилась сбоем на этом узле. Чтобы присоединить узел к кластеру, примените действие Назначение шаблона узла к узлу. В кластере высокой доступности после запуска установки на первом головном узле второй головной узел будет находиться в состоянии Неизвестное, пока программа установки не будет запущена на этом узле. После установки второй головной узел переходит в состояние Online. |
подготовки | Локальные узлы Это состояние указывает, что узел настраивается как узел кластера. назначить шаблон узла, повторное созданиеи поддержку действий также помещают узел в состояние подготовки. После завершения подготовки узел переходит в состояние автономного. Узлы Windows Azure Это состояние означает, что экземпляр узла развертывается в Windows Azure. Действие запуска или автоматическая политика доступности может поместить узел Windows Azure в состояние подготовки. После успешной подготовки узел Windows Azure, который запускается вручную, переходит в состояние автономного, а узел Windows Azure, запущенный автоматически, переходит в состояние Online. |
запуска | Это состояние указывает, что узел переходит из режима автономного в режим Online. |
очистка | Это состояние указывает, что узел был отключен и переходит в состояние автономного. Узел завершает выполнение заданий, прежде чем перейти к состоянию автономного. очистка узлов не принимает новые задания. |
удаление | Это состояние указывает, что сведения о узле удаляются из базы данных служб управления узлами HPC. Действие удаления Если узел пытается повторно присоединиться к кластеру, новая запись будет создана для этого узла в базе данных, а узел появится в состоянии неизвестного. |
отклоненные | Это состояние означает, что узел был отклонен администратором кластера. |
не развернутые | Это состояние применяется только к узлам Windows Azure. Это состояние указывает, что узел Windows Azure определен и добавлен в кластер, но узел не был запущен и подготовлен в Windows Azure (экземпляр узла не был создан в Windows Azure). Узлы Windows Azure развертываются в соответствии с политикой доступности, определенной в шаблоне узла: вручную (с действием запуска) или автоматически на основе еженедельного расписания. Узлы Windows Azure в состоянии не развернутые не несут расходов в Windows Azure. |
остановка |
Это состояние применяется только к узлам Windows Azure. Это состояние означает, что экземпляр узла Windows Azure удаляется из Windows Azure. Узлы Windows Azure остановлены в соответствии с политикой доступности, определенной в шаблоне узла: вручную (с действием остановить) или автоматически на основе еженедельного расписания. После завершения операций остановки (экземпляр узла удаляется из Windows Azure), узел переходит в состояние не развернутого. |
Работоспособности узлов
работоспособность узла указывает, существуют ли предупреждения или ошибки, о которых знают службы HPC на этом узле.
Представление списка узлов можно использовать для отображения работоспособности каждого вычислительного узла и фильтрации узлов по работоспособности узлов. Если работоспособность узла
В следующей таблице описываются значения работоспособности узлов:
Работоспособности узлов | Описание |
---|---|
OK | Службы HPC не знают о каких-либо проблемах с узлом. |
предупреждение | Это значение может указывать на следующее: — Администратор кластера выполнил диагностические тесты на узле, а один или несколько тестов вернул результат сбоя или не удалось запустить. Администратор может вручную очистить диагностические оповещения (см. разрешить и очистить оповещения диагностики). — Одна или несколько операций узла находятся в состоянии сбой, или отменено. прочитать журнал операций для изучения проблемы. Просмотрите сведения на вкладке работоспособности узла |
ошибка | Это значение может указывать на следующее: — Узел недоступен, как определено параметрами пульса . — Сбой подготовки. — узел был отклонен администратором кластера. (Вы можете назначить шаблон узла, если вы решите присоединить узел к кластеру.) Просмотрите сведения на вкладке работоспособности узла |
переходных | Это значение указывает, что узел выполняет операцию, инициированную администратором кластера, например: - назначить шаблон узла, повторное созданиеили обслуживание (в этом случае состояние узла подготовки). - перенос в режиме "Интернет" (в этом случае состояние узла запуск). - отключить (в этом случае состояние узла очистки). - запуск для узлов Windows Azure (в этом случае состояние узла подготовки). Перейдите на вкладку работоспособности узла |
неутвержденные | Локальные узлы Узел был обнаружен головным узлом, но он не является частью кластера. Назначьте шаблон узла для присоединения узла к кластеру. См. также добавление узлов в кластер. Узлы Windows Azure Узел был добавлен в кластер, но узел не был запущен и подготовлен в Windows Azure (экземпляр узла не существует в Windows Azure). |
Состояния операций
Сведения о просмотре журнала операций см. в разделе Чтение журнала операций.
В следующей таблице описаны значения состояния операции:
Состояние операции | Описание |
---|---|
Архивированные | Операция превышает 24 часа или тест диагностики был очищен. Когда операция архивируется, она удаляется из других отчетов о состоянии. |
зафиксированные | Операция успешно завершена. |
выполнение | Операция выполняется. |
Сбой | Не удалось выполнить операцию. |
отмена | Операция отменяется. После завершения очистки операции операция будет перемещена в состояние ", возвращенное. |
Не удалось восстановить | Очистка операции не была успешной. |
Отменено | Операция отменяется после сбоя или отмены. |