Esteganografía y LLMs: ¿Escondiéndose a plena vista?
Comentarios en el blog de **Bruce Schneier** discuten métodos de esteganografía, incluyendo el uso de texto blanco sobre fondo blanco y cambios fonológicos en palabras para evadir la detección por parte de **Modelos de Lenguaje Grandes (LLMs)**. La discusión aborda las limitaciones y posibles elusiones de estas técnicas, así como herramientas relacionadas para la mitigación TEMPEST y el marcado de texto.
La sección de comentarios de una reciente publicación del blog de **Bruce Schneier** ha generado una discusión sobre la esteganografía y su efectividad contra los **LLMs** modernos. Varios comentaristas exploraron diferentes técnicas para ocultar información dentro del texto. Aquí un resumen de los puntos clave:
### Técnicas Sencillas de Ocultación
Un comentarista sugirió un enfoque directo: usar texto blanco sobre fondo blanco para ocultar información al ojo humano, mientras permanece legible por máquinas. Otro mencionó el uso de fuente negra sobre fondo negro, estableciendo un paralelismo con tácticas de censura.
### Evadiendo LLMs con Cambios Fonológicos
**Derek Jones** describió sus intentos de obscurecer el significado para los **LLMs** introduciendo cambios fonológicos en las palabras. Presentó una oración de ejemplo con errores ortográficos deliberados, como "phashyon es cycklyq". Si bien anticipó que la tokenización de palabras dificultaría la decodificación por parte del **LLM**, descubrió que incluso modelos más pequeños podían manejar estas alteraciones con relativa facilidad.
### El Problema de las Capas
**Clive Robinson** enfatizó que la elección de la capa de lenguaje para la esteganografía es crucial. Las capas superiores (con mayor longitud de tokens) producen un estego-texto más coherente, pero pueden resultar en saltos de contexto notables. También señaló que los conceptos subyacentes no son nuevos y ya se han discutido previamente.
### Fuentes TEMPEST y Soft Tempest
La discusión se amplió para incluir TEMPEST (Transient Electromagnetic Emanation Standard) y técnicas para mitigar la fuga de información a través de la radiación electromagnética. Los comentaristas mencionaron "Zero Emission Pad", un programa antiguo de Windows diseñado para contrarrestar vulnerabilidades TEMPEST mediante el suavizado de fuentes. **Clive Robinson** citó el trabajo de **Markus G. Kuhn** en Cambridge Computer Labs sobre Soft Tempest Fonts y enlazó a una sección de preguntas frecuentes sobre el tema. Advirtió que la tecnología moderna de SDR (Software Defined Radio) ha avanzado significativamente las capacidades TEMPEST, lo que podría disminuir la efectividad de los enfoques más antiguos basados en fuentes.
### Herramientas y Recursos
Se mencionaron varias herramientas y recursos, entre ellos:
* `snowdrop`: Una herramienta disponible en Debian para el marcado de texto plano en inglés.
* `Tempest for Eliza`: Un programa gratuito/de código abierto que demuestra la inseguridad de los monitores al transmitir a radio AM/FM local.
* `TempestSDR`: Un programa para usuarios avanzados que utiliza tecnología SDR.
### LLMs: ¿Autocompletado Sobredimensionado?
Un comentarista, **MrC**, observó humorísticamente que el artículo de referencia parece transitar de un ingenioso método de esteganografía a la constatación de que los **LLMs** son esencialmente sistemas de autocompletado avanzados que carecen de inteligencia o intención real.
En conclusión, si bien existen diversas técnicas esteganográficas, su efectividad contra los **LLMs** modernos y las tecnologías de vigilancia avanzadas sigue siendo un tema de debate y desarrollo continuo. Los comentarios resaltan el constante juego del gato y el ratón entre quienes buscan ocultar información y quienes buscan extraerla.