Поделиться через


Аппаратные ошибки и источники ошибок

Ошибка оборудования является неисправностью аппаратного компонента в компьютерной системе. Аппаратные компоненты содержат механизмы обнаружения ошибок, которые могут обнаруживать, когда существует условие ошибки оборудования. Аппаратные ошибки можно классифицировать как исправленные ошибкиили неисправленные ошибки.

  • Исправленная ошибка — это состояние ошибки оборудования, которое было исправлено оборудованием или встроенным ПО до момента уведомления операционной системы о наличии этого состояния ошибки.

  • Неисправимая ошибка — это состояние ошибки оборудования, которое не может быть исправлено оборудованием или встроенным ПО. Неисправленные ошибки классифицируются как фатальные или нефатальные.

    • Неустранимая ошибка оборудования — это неисправленная или неконтролируемая ошибка, которую оборудование определяет как невосстановимую. При возникновении фатальной неустранимой ошибки операционная система инициирует проверку на наличие ошибок, чтобы локализовать ошибку.
    • Нефатальная аппаратная ошибка — это неисправленное состояние ошибки, из которого операционная система может попытаться восстановиться, исправляя ошибку. Если операционная система не может исправить ошибку, она выполняет проверку на наличие ошибки, чтобы управлять ею.

Понятие источника аппаратных ошибок является фундаментальной концепцией архитектуры аппаратных ошибок Windows (WHEA). Источник ошибки оборудования — это любая аппаратная единица, которая оповещает операционную систему о наличии условия ошибки. Примеры источников ошибок оборудования включают следующие сценарии:

  • Исключение машинной проверки процессора (например, MC#)

  • Сигналы об ошибках набора микросхем (например, SCI, SMI, SERR#, MCERR#)

  • Отчеты об ошибках шины ввода-вывода (например, прерывание ошибки корневого порта PCI Express)

  • Ошибки устройства ввода-вывода

Один источник ошибки оборудования может обрабатывать отчеты об ошибках нескольких типов аппаратных ошибок. Например, исключение проверки машины процессора, как правило, сообщает об ошибках процессора, кэш-памяти и системной шины.

Заметка

Системное прерывание управления (SMI) обрабатывается встроенным ПО, а не операционной системой.

Источник ошибки оборудования обычно представлен следующим образом:

  • Один или несколько регистров состояния ошибки оборудования

  • Одна или несколько аппаратных регистров ошибок или элементов управления

  • Механизм сигнализации для оповещения операционной системы о наличии условия ошибки оборудования

В некоторых ситуациях нет явного механизма сигнализации, и операционная система должна опрашивать регистры состояния ошибки, чтобы проверить состояние ошибки. Однако опрос можно использовать только для условий, в которых ошибки уже устранены, так как неустранённые ошибки требуют немедленного внимания операционной системы.

Начиная с Windows Vista операционная система поддерживает список всех источников ошибок оборудования, которые можно обнаружить на определенной аппаратной платформе. WHEA использует механизм обнаружения, когда операционная система начинает определять, какие из этих источников ошибок оборудования существуют в определенной системе. Средства, с помощью которых эта информация предоставляется операционной системе, зависит от платформы. Операционная система собирает эти сведения из сочетания таблиц ACPI, взаимодействия встроенного ПО и других механизмов, относящихся к платформе.

Заметка

Windows Vista не собирает сведения об источнике ошибок оборудования из таблиц ACPI. Однако начиная с Windows Server 2008 и Windows Vista с пакетом обновления 1 (SP1) операционная система использует таблицы ACPI для сбора сведений об источнике ошибок оборудования.