GPUBreach: Nuevos Ataques RowHammer Apuntan a GPUs, Llevando a Escalada de Privilegios y Potencial Compromiso del Sistema
Nueva investigación ha descubierto una serie de ataques RowHammer dirigidos a GPUs de alto rendimiento, denominados **GPUBreach**, **GDDRHammer** y **GeForge**. Estos ataques pueden escalar privilegios y potencialmente otorgar a los atacantes control total de un sistema anfitrión al explotar vulnerabilidades en la gestión de memoria de la GPU.

### GPUBreach: Un Análisis Profundo
El ataque **GPUBreach** va más allá de la investigación previa de **GPUHammer** al demostrar que los volteos de bits (bit-flips) de RowHammer en la memoria de la GPU pueden hacer más que solo corromper datos. Los investigadores han probado que puede llevar a la escalada de privilegios e incluso al compromiso total del sistema.
Según Gururaj Saileshwar, Profesor Asistente en la **University of Toronto** y uno de los autores del estudio, "Al corromper las tablas de páginas de la GPU a través de volteos de bits en GDDR6, un proceso no privilegiado puede obtener lectura/escritura arbitraria de memoria de GPU, y luego encadenarlo a una escalada completa de privilegios de CPU —iniciando un shell root— al explotar errores de seguridad de memoria en el driver de **NVIDIA**."
Lo que distingue a GPUBreach es su capacidad para funcionar incluso con la unidad de gestión de memoria de entrada-salida (**IOMMU**) habilitada. La IOMMU es un componente de hardware crítico diseñado para prevenir ataques de Acceso Directo a Memoria (DMA) y aislar periféricos a su propio espacio de memoria.
Saileshwar explica: "GPUBreach demuestra que no es suficiente: al corromper el estado del driver de confianza dentro de buffers permitidos por la IOMMU, activamos escrituras fuera de límites a nivel de kernel —eludiendo las protecciones de la IOMMU por completo sin necesidad de deshabilitarla. Esto tiene implicaciones serias para la infraestructura de IA en la nube, despliegues de GPU multi-inquilino y entornos HPC."
### Entendiendo RowHammer
RowHammer es un problema de fiabilidad bien conocido de la Memoria de Acceso Aleatorio Dinámica (DRAM). Accesos repetidos a una fila de memoria pueden causar interferencia eléctrica que voltea bits en filas adyacentes, socavando las garantías de aislamiento que son fundamentales para los sistemas operativos modernos y los sandboxes.
Los fabricantes de DRAM han implementado mitigaciones a nivel de hardware, como Código de Corrección de Errores (ECC) y Actualización Dirigida de Filas (TRR), para combatir los ataques RowHammer.
### Precedente de GPUHammer
Investigaciones publicadas en julio de 2025 por la **University of Toronto** extendieron la amenaza RowHammer a las GPUs con **GPUHammer**. Este ataque apunta a GPUs **NVIDIA** que usan memoria GDDR6 y utiliza técnicas como el hammering paralelo multi-hilo para superar desafíos arquitectónicos que previamente hacían a las GPUs inmunes a los volteos de bits.
Un exploit exitoso de GPUHammer puede llevar a una caída significativa en la precisión de los modelos de aprendizaje automático (ML), degradándola potencialmente hasta en un 80%.
### Impacto de GPUBreach
GPUBreach se basa en GPUHammer al corromper las tablas de páginas de la GPU con RowHammer para lograr la escalada de privilegios, permitiendo acceso de lectura/escritura arbitrario a la memoria de la GPU. Más alarmantemente, se ha demostrado que el ataque filtra claves criptográficas secretas de **NVIDIA cuPQC**, escenifica ataques de degradación de precisión de modelos y logra escalada de privilegios de CPU incluso con la IOMMU habilitada.
Los investigadores declararon: "La GPU comprometida emite DMA (usando los bits de apertura en las PTEs) a una región de memoria de CPU que la IOMMU permite (los propios buffers del driver de la GPU). Al corromper este estado del driver de confianza, el ataque activa errores de seguridad de memoria en el driver del kernel de NVIDIA y obtiene una primitiva de escritura arbitraria en el kernel, que luego se utiliza para iniciar un shell root."
### GDDRHammer y GeForge: Descubrimientos Concurrentes
La divulgación de GPUBreach coincide con otros dos esfuerzos de investigación independientes, **GDDRHammer** y **GeForge**, que también se centran en la corrupción de tablas de páginas de GPU a través de RowHammer en GDDR6 para lograr la escalada de privilegios del lado de la GPU. Al igual que GPUBreach, ambas técnicas pueden usarse para obtener acceso de lectura/escritura arbitrario a la memoria de la CPU.
GPUBreach se distingue por permitir la escalada completa de privilegios de CPU, lo que lo convierte en un ataque más potente. GeForge requiere que la IOMMU esté deshabilitada, mientras que GDDRHammer modifica el campo de apertura de la entrada de la tabla de páginas de la GPU para permitir que el kernel CUDA no privilegiado lea y escriba toda la memoria de la CPU anfitriona.
Los investigadores detrás de GDDRHammer y GeForge señalaron: "Una diferencia principal es que GDDRHammer explota la tabla de páginas de último nivel (PT) y GeForge explota el directorio de páginas de último nivel (PD0). Sin embargo, ambos trabajos son capaces de lograr el mismo objetivo de secuestrar la traducción de la tabla de páginas de la GPU para obtener acceso de lectura/escritura a la memoria de la GPU y del host."
### Estrategias de Mitigación
Una mitigación temporal es habilitar ECC en la GPU. Sin embargo, ataques RowHammer como **ECCploit** y **ECC.fail** han demostrado la capacidad de eludir esta contramedida.
Los investigadores advierten: "Sin embargo, si los patrones de ataque inducen más de dos volteos de bits (demostrado factible en sistemas DDR4 y DDR5), el ECC existente no puede corregirlos e incluso puede causar corrupción silenciosa de datos; por lo tanto, ECC no es una mitigación infalible contra GPUBreach. En GPUs de escritorio o portátiles, donde el ECC no está disponible actualmente, no conocemos mitigaciones hasta donde sabemos."