PFA realizada por un Plug-In PSHED
Un complemento de controlador de error de hardware (PSHED) específico de la plataforma puede realizar análisis de errores predictivos (PFA) en la memoria ECC. Cuando esto ocurre, el complemento y no WHEA debe supervisar las páginas de memoria ECC. Si el complemento determina que una página de memoria ECC ha superado un umbral de error, indica este estado a WHEA. WHEA intenta desconectar la página de memoria.
Nota Si el complemento PSHED realiza PFA y usa el Registro para almacenar sus opciones de configuración, como umbrales de error y tiempos de espera de supervisión, no debe confiar en ni usar las opciones de configuración de PFA de WHEA descritas en Configuración de directivas de WHEA.
Cuando se produce un error de memoria ECC, WHEA y el complemento realizan los pasos siguientes:
Se notifica al controlador de errores de hardware de bajo nivel (LLHEH) sobre la presencia de la condición de error de memoria.
LlHEH recupera información sobre el error de memoria del origen de error y usa los datos de error para completar un paquete de error de hardware. Este paquete tiene el formato de estructura WHEA_ERROR_PACKET .
LlHEH llama al PSHED para recuperar cualquier información de error de hardware específica de la plataforma. Si se instala un complemento PSHED y se registra para recuperar información sobre los errores, el PSHED llamará al complemento PSHED para que el complemento pueda modificar la información sobre el error que se devuelve al LLHEH.
LlHEH llama al kernel del sistema operativo Windows y lo pasa el paquete de error.
El kernel de Windows crea un registro de error y lo agrega a la información del paquete de error que se recibió de LLHEH. Además, el kernel de Windows agrega otra información sobre el error, como el origen del error, la gravedad del error y cuántas veces se ha producido el error en el registro de errores.
El kernel de Windows llama al PSHED para permitir que el PSHED agregue secciones al registro de errores.
Si se instala un complemento PSHED y se registra para recuperar información de error, el PSHED llamará al complemento PSHED para que pueda modificar la información en el registro de errores.
Si el complemento PSHED está realizando PFA en la página de memoria ECC, debe hacer lo siguiente:
- Establezca el bit PlatformPfaControl en el miembro WHEA_ERROR_PACKET_FLAGS de la estructura WHEA_ERROR_PACKET . Si se establece este bit, WHEA ya no es responsable de PFA en esa página de memoria.
- Si el complemento determina que la página de memoria ECC que encontró el error se debe desconectar, establezca el bit PlatformDirectedOffline en el miembro WHEA_ERROR_PACKET_FLAGS . Si se establece este bit, WHEA intenta desconectar la página de memoria.
De lo contrario, el complemento PSHED debe borrar los bits PlatformPfaControl y PlatformDirectedOffline en el miembro WHEA_ERROR_PACKET_FLAGS de la estructura WHEA_ERROR_PACKET .
Nota Si se borra el bit PlatformPfaControl , WHEA realiza PFA si está configurado para ello y determinará si la página de memoria ECC que encontró el error se debe desconectar. Para obtener más información sobre este proceso, vea PFA Realizado por WHEA.
Si la página de memoria ECC se debe desconectar, WHEA llama primero al administrador de memoria del sistema para realizar esta operación.
Nota Cuando se llama al administrador de memoria del sistema, no hay ninguna garantía de que la página de memoria ECC se desconecte realmente.
WHEA agrega la página de memoria al almacén de datos de configuración de arranque (BCD) en el sistema. Esto impide que la página de memoria se use después del siguiente reinicio del sistema.
Nota WHEA no tomará un componente de hardware, como una página de memoria ECC, sin conexión si el valor del Registro DisableOffline está establecido en un valor distinto de cero. Además, WHEA no agregará la página de memoria al almacén BCD si el valor del Registro MemPersistOffline está establecido en 0. Para obtener más información sobre los valores del Registro, vea Configuración de directivas de WHEA.
Para obtener más información sobre el administrador de memoria del sistema, consulte Administración de memoria en la documentación de Windows SDK.
- El kernel de Windows genera un evento ETW y registra la información de error en el registro de eventos del sistema.