Поделиться через


Устранение неполадок при тестировании системного сервера

Чтобы устранить неполадки, возникающие при работе с тестами System.Server пакета Windows Hardware Lab Kit (Windows HLK), выполните действия, описанные в этой статье.

Содержание этой статьи

Общие сведения об устранении неполадок системного сервера

  1. Ознакомьтесь со следующими статьями для получения справки по тестированию сервера.

  2. Для тестирования серверного устройства и драйвера убедитесь, что тестируемая система (SUT) настроена следующим образом:

    • Установлена правильная версия Windows.

    • Установлен параметр Server Core.

    • SUT имеет не менее четырех ядер и логических процессоров.

    • На SUT установлено не менее 6 ГБ ОЗУ.

    • Для тестирования запоминающего устройства может потребоваться два экземпляра устройства с дисками хранения, если запоминающее устройство является загрузочным устройством.

  3. Если появляется сообщение об ошибке о том, что Windows HLK Studio не удалось добавить целевые объекты в проект, повторно выберите целевой объект, закройте Windows HLK Studio и перезапустите Windows HLK Studio. Ошибка означает, что данные не обновляются.

  4. Процесс Sysparse напрямую запускает библиотеки DLL средства сбора данных. Второй процесс, Asset Configuration Manager Engine (ACME), наблюдает за изменениями оборудования и оповещает систему при возникновении одного или нескольких изменений оборудования. ACME ожидает истечения времени ожидания или частых отчетов об изменении оборудования, прежде чем инициировать подписаемых сборщиков.

    Некоторые тесты вызывают изменения оборудования на протяжении всего тестового запуска. Это приводит к регулярному запуску Sysparse. Sysparse может потреблять большие объемы памяти, что вызвано тем, что средства сбора данных выполняют и собирают данные. Sysparse не должен мешать тестированию, так как в большинстве случаев тесты не проверяют производительность.

  5. Убедитесь, что система, в которой установлен контроллер Windows HLK, обладает достаточными аппаратными возможностями для удовлетворения требований к тестированию. Описание этих требований к оборудованию см. в разделе Предварительные требования Windows HLK . По мере увеличения количества устройств и систем, которые тестируются, может потребоваться добавить дополнительные процессоры, память или хранилище.

Устранение неполадок при неудачных тестах системного сервера

Если тест завершается сбоем, выполните следующие действия.

  1. Если сбой происходит в течение нескольких минут после запуска теста, обычно это означает, что что-то было настроено неправильно. Повторно подтверждите настроенную тестовую среду.

  2. Если тест выполнен, в контроллере Windows HLK должен быть файл журнала с именем Srvlog.xml. Выполните указанные ниже действия:

    1. В Windows HLK Studio откройте монитор заданий.

    2. Перейдите к пулу компьютеров запланированного теста.

    3. В области Состояние выполнения задания выберите Loadgen Server Stress — Start Test for Server (Loadgen Server Stress — Start Test for Server).

    4. В области Состояние выполнения задачи щелкните правой кнопкой мыши RunJob -Launch Server Logo Kit и выберите Дочерний результат задания.

    5. Вернитесь в область Состояние выполнения задания и выберите Запустить комплект логотипов сервера.

    6. В области Состояние выполнения задачи щелкните правой кнопкой мыши Запустить задачу LogGen и выберите Просмотр журнала задач. Журнал анализируется из исходного журнала Loadgen и содержит только ошибки и проходы.

    7. Чтобы получить исходный текстовый журнал Loadgen, повторите шаги 1–5, щелкните правой кнопкой мыши Launch Server Logo Kit (Запустить комплект логотипов сервера ) и выберите Обзор журналов заданий. Откроется общая папка журнала на контроллере Windows HLK; Файл журнала Loadgen srv.log находится в общей папке.

    8. Перетащите файл srv.log в Блокнот.

    9. В Блокноте прокрутите файл вниз.

    10. Снизу вверх найдите строку "Ошибка -". Текст в той же строке будет описывать сбой. Возможно, потребуется выполнить поиск несколько раз, чтобы найти причину сбоя. Сведения в файле журнала предоставляют только высокоуровневый индикатор того, что завершилось сбоем.

Loadgen запрашивает больше клиентов

Если существующие клиенты не могут создать достаточно нагрузки на SUT, Loadgen запрашивает дополнительные клиенты нагрузки (SCs). Эта функция предназначена для размещения больших серверов и вероятности сбоя некоторых SCs в середине выполнения. Как правило, следует начать с восьми SCS. Уровень стресса должен стабилизироваться в первые три-четыре часа теста. Если требуется больше клиентов, вы обычно увидите всплывающее окно в контроллере master (MC) в этот период времени. У вас будет шестьдесят минут, чтобы добавить новый клиент, иначе тест завершится и завершится сбоем.

Примечание

Вы не сможете добавить дополнительные компьютеры в пул компьютеров после запуска отправки. Если вы запускаете тест с использованием менее восьми клиентов, убедитесь, что у вас есть дополнительные клиенты в пуле компьютеров, прежде чем приступать к тестированию.

Если Loadgen запрашивает больше клиентов после четырех часов тестирования, это, вероятно, означает, что что-то завершилось сбоем. Один или несколько существующих клиентов выбыли, возникли проблемы с сетевым подключением или другая проблема не позволяет SUT проверить необходимую нагрузку на 40 %. Это может быть проблема драйвера сетевого адаптера в сочетании со скоростью сети или реализацией драйвера счетчиков монитора производительности, от которых зависит MC Loadgen.

В этом случае попробуйте выполнить следующие действия по устранению неполадок:

  1. Чтобы исключить временный сбой оборудования в сетевом адаптере, используйте другой сетевой адаптер, который является той же моделью и производителем.

  2. Используйте другую модель сетевого адаптера того же производителя, но в котором используется тот же драйвер.

  3. Используйте сетевой адаптер и драйвер от другого драйвера производителя.

  4. Если один или несколько сетевых адаптеров установлены непосредственно на системной плате, перейдите к настройке системы оборудования и отключите сетевой адаптер на этом уровне, чтобы Windows не обнаружила его. затем используйте другое устройство и драйвер для тестирования.

  5. Если на системной плате установлено несколько сетевых адаптеров и вы не можете установить дополнительное устройство в слот PCI Express, перейдите к настройке аппаратной системы и отключите все сетевые адаптеры, кроме одной, чтобы Windows не обнаружила их.

Примечание

Каждый обнаруженный сетевой адаптер должен быть подчеркнут во время теста. Для этого необходимо, чтобы каждый сетевой адаптер был в отдельном физическом сегменте сети.

Коммутаторы с расширенными функциями, встроенными в них, могут мешать тестированию различными способами. Пример:

  • Коммутатор может замедлять работу портов в коммутаторе, если обнаруживает удаленные пакеты или другие ошибки на одном порту. Если сетевая карта 10GigE в SUT предназначена для получения трафика, который будет возникать из-за замедления всех портов до 1 GigE, тест Loadgen не может достичь необходимого уровня использования пропускной способности сети 40 %, необходимого для прохождения теста.

  • Коммутатор может направлять трафик или сегментировать сеть в ответ на правила и логику, которые используются для коммутатора (например, балансировка нагрузки, избыточность, качество обслуживания (QoS), зеркальное отображение, дуплексное сравнение. симплексная операция, адаптивное или интеллектуальное моста, определение приоритетов портов или фильтрация MAC), которая может повлиять на уровень использования пропускной способности сети на сетевом адаптере.

Error=0x80004005

Если появляется следующая ошибка: Main::RunMain:: Test Check, Spsrv остановлена и не прошла обязательный процент прохода (100) (Error=0x80004005). В этом случае сделайте следующее.

  1. Закройте Windows HLK Studio.

  2. Измените имя компьютера SUT на 15 символов или меньше.

  3. Перезагрузите SUT.

  4. Откройте Windows HLK Studio и повторно запустите тест LoadGen Server Stress — Start Test for Server .

Нагрузочные тесты сервера

При выполнении нагрузочных тестов сервера убедитесь, что сетевая инфраструктура, которая подключает SUT к SCS и MC, может выполняться на уровне сетевого интерфейса карта (NIC) в SUT. Если SUT имеет одну или несколько сетевых адаптеров 10GigE, SCs и сетевая инфраструктура должны соответствовать такому уровню производительности.

Убедитесь, что сетевая инфраструктура, которая подключает DHCP, DNS, Active Directory, контроллер Windows HLK, Windows HLK Studio, SUT, SCS и MC, работает правильно. Все системы должны взаимодействовать друг с другом, используя имя узла или IP-адрес. Это можно подтвердить с помощью простого теста проверки связи.

Убедитесь, что серверы DHCP, DNS и Active Directory работают правильно. Устаревших записей DNS не должно быть. DHCP-сервер должен быть авторизован для работы в сети, конфигурация должна быть правильной, области DHCP должны быть правильными, не должно быть неправильной множественной адресации и не должно быть ошибок в журнале системных событий DHCP. Контроллер домена Active Directory не должен сообщать об ошибках, а служба времени должна быть синхронизирована во всех системах.

Использование виртуальных машин в тестовой среде

Нет известных проблем в DHCP, DNS, AD и других системах, которые находятся на виртуальной машине. Проблемы могут возникнуть из-за того, что на виртуальной машине запущены контроллеры безопасности. Эти проблемы обычно связаны с созданием нагрузки пропускной способности сети. Чтобы избежать проблем, убедитесь, что настроена следующая конфигурация:

  • Каждая виртуальная машина SC должна иметь выделенный физический сетевой адаптер для загрузки сети, подключенной к сетевому адаптеру SUT.

  • Как минимум, у вас должны быть физические сетевые адаптеры, сопоставленные с виртуальными машинами SC, которые могут по крайней мере в два раза превышать максимальную пропускную способность сетевого адаптера SUT.

  • Убедитесь, что физические системы, используемые для виртуальных машин SC, не перегружены высоким уровнем загрузки ЦП и что для всех виртуальных машин достаточно физической памяти.

Тестирование System.Server