PC se congela a los 10 minutos: guía WHEA Logger ID 16 en PCIe y solución con riser y montaje de GPU

¿Tu PC se congela con precisión a los 10 minutos de arrancar y, tras forzar un reinicio, queda estable durante el resto de la sesión? Aquí encontrarás un caso real documentado, cómo se diagnosticó con eventos WHEA‑Logger en PCIe y cómo se resolvió de forma definitiva, además de un método replicable paso a paso.

Índice

Resumen de la pregunta

El equipo se bloqueaba siempre en torno al minuto diez después de encenderse. Tras mantener pulsado el botón de encendido y forzar un reinicio, el sistema funcionaba con normalidad durante horas. El usuario pedía ayuda para identificar el origen y eliminar por completo el problema.

Diagnóstico aplicado

Revisión de registros

El Visor de eventos reveló un patrón coherente con un fallo de bus:

  • Advertencias PCA file tracing y errores críticos WRE con Event ID 4502 poco antes del congelamiento.
  • Eventos WHEA‑Logger con Event ID 16 señalando errores de PCI Express en el Root Port 0:1:0, con cadenas de dispositivo VEN8086 y DEV460D (controladora de Intel).
  • El detalle AER indicaba Uncorrectable Non‑Fatal con código 0x10, típico de problemas en la capa física del enlace PCIe.

Pruebas de software y firmware

Para descartar causas lógicas se ejecutaron acciones en escalada:

  • Actualización de controladores de GPU, chipset, WLAN y de Windows (incluida la acumulativa KB5035942).
  • Arranque limpio (Clean Boot) para aislar servicios de terceros.
  • Comprobaciones de memoria con Windows Memory Diagnostic y verificación de disco sin errores.
  • Desactivación de opciones potencialmente inestables en la BIOS (XMP, ReBAR, Intel RST) y fijación manual del enlace PCIe a Gen 3 para reducir sensibilidad.

Hipótesis de hardware

Los eventos WHEA apuntaban a un fallo en la capa física del enlace PCIe que aloja la GPU. Se barajaron tres causas principales:

  1. Conexión deficiente de la tarjeta en la ranura.
  2. Riser cable defectuoso o fuera de especificación.
  3. Estrés mecánico por peso de la GPU y montaje con ángulo en chasis ITX.

Solución definitiva

  • Se retiró la GPU y el riser, se limpiaron contactos y se aseguró el montaje.
  • Se observó holgura en la tarjeta y asentamiento imperfecto del riser en la placa ITX debido al soporte de noventa grados y al peso de la gráfica.
  • Tras reinstalar con firmeza y soporte mecánico adecuado, el equipo funcionó varios días sin bloqueos. El incidente quedó resuelto.

Guía práctica para replicar el diagnóstico

Preparación del sistema

  • Cronometra el tiempo exacto hasta la congelación y toma notas de lo que ocurre en pantalla. Repite durante un par de sesiones para confirmar el patrón.
  • Activa un plan de energía equilibrado o de alto rendimiento para reducir transiciones agresivas a estados de bajo consumo durante las pruebas.

Comprobaciones en el visor de eventos

Abre eventvwr.msc y revisa estas rutas:

  • Registros de Windows ▸ Sistema → Filtra por Origen: WHEA‑Logger. Anota Event ID, Bus, Device, Function y los campos AER.
  • Comprueba también WRE y Application and Service Logs si aparecen PCA file tracing o advertencias relacionadas con compatibilidad.

Comandos útiles en PowerShell para acelerar la revisión:

# Últimos eventos WHEA de sistema
Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='WHEA-Logger'; Id=16} |
  Select-Object TimeCreated, Id, LevelDisplayName, Message -First 20

Exportar un resumen a CSV

Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='WHEA-Logger'} |
Select TimeCreated, Id, Message | Export-Csv "\$env\:USERPROFILE\Desktop\WHEA.csv" -NoTypeInformation 

Pruebas de memoria y disco

  • Ejecuta Windows Memory Diagnostic y deja que complete el ciclo extendido.
  • Para el almacenamiento, usa chkdsk /scan o la herramienta de estado SMART de tu preferencia. La ausencia de errores ayuda a centrar el foco en PCIe.

Ajustes de firmware y pcie

  • Desactiva temporalmente XMP, Resizable BAR e Intel RST. Vuelve al perfil JEDEC en la memoria.
  • Fuerza la velocidad del enlace a Gen 3 en la BIOS (suele estar en PCI Subsystem Settings ▸ PCIe Link Speed). Si el problema desaparece, refuerza la hipótesis de capa física.
  • Mantén la BIOS y, si procede, la VBIOS en versiones estables certificadas por el fabricante.

Inspección física de gpu y riser

  1. Apaga, desconecta la corriente y descarga la electricidad estática. Retira paneles del chasis para trabajar con comodidad.
  2. Quita la GPU, limpia los contactos con isopropílico y un paño sin pelusa. Evita abrasivos.
  3. Si usas riser: verifica longitud, uniones, blindaje y conectores. Un riser de baja calidad o doblado con exceso es una fuente común de AER.
  4. Reinstala la gráfica asegurando tornillos y empleando un soporte anti‑sag. La tarjeta no debe bailar ni quedar a tensión.
  5. Prueba si es posible sin riser, conectando la GPU directamente a la placa. Si desaparecen los eventos WHEA, el culpable es el riser o el montaje.

Pruebas de estabilidad

  • Ejecuta cargas sostenidas como FurMark, OCCT o 3DMark y observa si vuelven los eventos WHEA. La estabilidad bajo estrés confirma que el enlace está sano.
  • Comprueba también periodos de reposo y cambios de estado de energía, que es cuando suelen aparecer errores AER en enlaces sensibles.

Tabla de eventos clave y pistas de diagnóstico

Origen e identificadorMensaje típicoQué sugiereAcción recomendada
PCA file tracingAdvertencias cercanas al bloqueoActividad del asistente de compatibilidad; no suele ser la causa raízUsar como marca temporal, correlacionar con otros eventos
WRE id 4502Error crítico previo al congelamientoImpacto a nivel de experiencia; síntoma, no causaInvestigar eventos de hardware inmediatamente anteriores
WHEA‑Logger id 16PCI Express Root Port Bus 0 Device 1 Function 0Fallo en la capa física del enlace PCIe; AER 0x10 no fatalReasentar GPU, revisar riser, probar Gen 3, inspección mecánica

Por que un enlace pcie defectuoso provoca congelamientos

El subsistema WHEA de Windows registra errores provenientes de la plataforma. En PCIe, el mecanismo AER reporta condiciones corregibles o no corregibles. Un Non‑Fatal Uncorrectable suele indicar pérdidas de señal o problemas de temporización que el protocolo no puede resolver sin intervención del sistema operativo. El resultado típico es congelamiento o caída del controlador gráfico. Esto se agrava durante transiciones de energía o cuando el enlace cambia de velocidad y anchura (link training), algo que puede ocurrir a los pocos minutos del arranque cuando el sistema entra en estados de bajo consumo o activa tareas de mantenimiento.

Buenas practicas de montaje y cableado

  • Alineación: la tarjeta debe entrar recta y al fondo. Evita forzar el conector con ángulos.
  • Soporte: usa un bracket o soporte anti‑sag para tarjetas pesadas.
  • Riser: prefiere modelos blindados, de longitud moderada y certificados para la generación del enlace que pretendes usar. Evita radios de curvatura pequeños.
  • Alimentación: comprueba que los conectores PCIe del PSU estén firmes, sin juego ni calentamiento. En cables conector 12VHPWR, revisa que esté insertado por completo.

Recomendaciones complementarias

ÁreaAcción preventiva
Conexiones PCIeVerificar apriete de la tarjeta, tornillos de retención y, si se usa, reemplazar el riser por uno de calidad o montar la GPU directamente.
AlimentaciónConfirmar cables PCIe del PSU sin holgura ni picos de caída de voltaje.
FirmwareMantener BIOS y VBIOS al día; si una actualización previa fue problemática, aplicar solo versiones estables recomendadas por el fabricante.
MonitoreoVigilar eventos WHEA; cualquier nuevo id 16 en el mismo Root Port indica persistencia o reaparición del problema.
Pruebas de estrésEjecutar FurMark, OCCT o 3DMark para validar estabilidad bajo carga prolongada.
Plan bSi los errores vuelven, probar la GPU en otro sistema o usar otra ranura o motherboard; considerar RMA de riser, GPU o placa base.

Protocolo de solucion paso a paso

  1. Actualiza Windows y controladores de GPU y chipset.
  2. Aplica un arranque limpio para descartar software de terceros.
  3. Revisa el Visor de eventos y confirma la aparición de WHEA‑Logger id 16 asociados a un Root Port.
  4. Cambia temporalmente el enlace PCIe a Gen 3 y desactiva XMP, ReBAR y RST.
  5. Reseata la GPU, retira y prueba sin riser si existe, o sustituye por uno certificado.
  6. Estresa el sistema y monitoriza si reaparecen los eventos. Si no vuelven, devuelve gradualmente la configuración anterior (Gen 4, XMP, etc.) comprobando estabilidad en cada paso.

Errores frecuentes al intentar solucionarlo

  • Asumir que el problema es de software cuando los WHEA apuntan a PCIe.
  • Forzar el conector del riser con curvaturas agresivas que degradan la señal.
  • Olvidar el soporte anti‑sag en chasis compactos con tarjetas pesadas.
  • Dejar XMP o overclocks activos durante el diagnóstico, añadiendo variables.
  • No registrar los tiempos y eventos, lo que dificulta ver el patrón de los diez minutos.

Como documentar y vigilar a futuro

Crea una línea de tiempo simple con el minuto exacto de arranque, primer uso de escritorio, activación de salvapantallas o suspensión de pantalla y el instante del bloqueo. Si vuelves a ver WHEA id 16 en el mismo Root Port, actúa de inmediato: revisa tornillería, asiento del conector y, si hay riser, sustitúyelo preventivamente.

Preguntas frecuentes

¿Por que ocurre con tanta precisión tras el arranque?
Porque en ese intervalo suelen confluir tareas de mantenimiento, cambios de estado de energía y renegociación del enlace PCIe. Si el riser o el asiento de la GPU están en el límite, una transición de potencia o velocidad dispara AER y acaba en congelamiento.

¿Cambiar a Gen tres es una solucion definitiva?
No necesariamente. Es un paliativo útil para diagnosticar sensibilidad del enlace. La corrección real pasa por resolver la causa física: montaje, riser o placa.

¿Puede ser fallo de la fuente de alimentacion?
Sí. Un conector flojo o una caída transitoria en la línea PCIe puede manifestarse como errores WHEA. Revisa cables, divisores y la integridad del conector en la tarjeta.

¿Conviene actualizar la bios o la vbios?
Sí, siempre que el fabricante marque la versión como estable y relevante para compatibilidad PCIe o gestión de energía. Evita betas durante el diagnóstico.

¿Es peligroso forzar el apagado?
Puede provocar corrupción de datos. Una vez resuelto el origen, no deberían ser necesarios nuevos apagados forzados.

Conclusiones

Cuando un PC se congela exactamente a los 10 minutos del arranque y luego funciona perfecto tras reiniciar, los eventos WHEA id 16 que señalan un Root Port PCIe son una pista clave. El caso documentado demostró que el problema se debía a una interconexión física deficiente entre GPU y placa a través de un riser: bastó con retirar, limpiar y montar con soporte adecuado para eliminar la congelación. Con el protocolo descrito —revisión de registros, descarte de software, ajustes de firmware y verificación mecánica— es posible identificar y atajar el origen físico del fallo y recuperar una estabilidad duradera.

Índice