Erros de hardware e fontes de erro
Um de erro de hardware é um mau funcionamento de um componente de hardware num sistema informático. Os componentes de hardware contêm mecanismos de deteção de erros que podem detetar quando existe uma condição de erro de hardware. Os erros de hardware podem ser classificados como erros corrigidosou erros não corrigidos.
Um erro corrigido é uma condição de erro de hardware que foi corrigida pelo hardware ou pelo firmware no momento em que o sistema operacional é notificado sobre a presença da condição de erro.
Um erro não corrigido é uma condição de erro de hardware que não pode ser corrigida pelo hardware ou pelo firmware. Erros não corrigidos são classificados como fatais ou não-fatais .
- Um erro fatal de hardware é uma condição de erro não corrigida ou não contida que é determinada como irrecuperável pelo hardware. Quando ocorre um erro fatal não corrigido, o sistema operacional gera uma verificação de bug para conter o erro.
- Um erro de hardware não fatal é uma condição de erro não corrigida a partir da qual o sistema operacional pode tentar a recuperação tentando corrigir o erro. Se o sistema operacional não puder corrigir o erro, ele gerará uma verificação de bug para conter o erro.
A noção de que o hardware é uma fonte de erro é um conceito fundamental da Arquitetura de Erro de Hardware do Windows (WHEA). Uma fonte de erro de hardware é qualquer unidade de hardware que alerta o sistema operacional para a presença de uma condição de erro. Exemplos de fontes de erro de hardware incluem os seguintes cenários:
Exceção de verificação da máquina do processador (por exemplo, MC#)
Sinais de erro do chipset (por exemplo, SCI, SMI, SERR#, MCERR#)
Relatório de erros de barramento de E/S (por exemplo, interrupção de erro de porta raiz PCI Express)
Erros do dispositivo de E/S
Uma única fonte de erro de hardware pode lidar com o relatório de erros para mais de um tipo de condição de erro de hardware. Por exemplo, uma exceção de verificação de máquina do processador normalmente relata erros de processador, erros de cache, erros de memória e erros de barramento do sistema.
Observação
A interrupção de gerenciamento do sistema (SMI) é tratada pelo firmware, não pelo sistema operacional.
Uma fonte de erro de hardware é normalmente representada por:
Um ou mais registos de estado de erro de hardware
Um ou mais registros de controle ou configuração de erro de hardware
Um mecanismo de sinalização para alertar o sistema operacional de que existe uma condição de erro de hardware
Em algumas situações, não há um mecanismo de sinalização explícito e o sistema operacional deve pesquisar os registros de status de erro para testar uma condição de erro. No entanto, a sondagem só pode ser usada para condições de erro corrigidas porque erros não corrigidos exigem atenção imediata por parte do sistema operacional.
A partir do Windows Vista, o sistema operacional mantém uma lista de todas as fontes de erro de hardware que podem ser descobertas em uma plataforma de hardware específica. O WHEA usa um mecanismo de descoberta quando o sistema operacional é iniciado para determinar quais dessas fontes de erro de hardware existem em um sistema específico. O meio pelo qual essas informações são expostas ao sistema operacional é específico da plataforma. O sistema operacional coleta essas informações de uma combinação de tabelas ACPI, interações de firmware e outros mecanismos específicos da plataforma.
Observação
O Windows Vista não coleta informações de origem de erro de hardware de tabelas ACPI. No entanto, a partir do Windows Server 2008 e do Windows Vista SP1, o sistema operacional usa tabelas ACPI para coletar informações de origem de erro de hardware.