Stéganographie et LLM : Se cacher à la vue de tous ?
Des commentaires sur le blog de **Bruce Schneier** discutent de méthodes de stéganographie, y compris l'utilisation de texte blanc sur fond blanc et de changements phonologiques dans les mots pour échapper à la détection par les **Grands Modèles de Langage (LLM)**. La discussion aborde les limites et les contournements potentiels de ces techniques, ainsi que des outils connexes pour l'atténuation TEMPEST et le tatouage de texte.
La section des commentaires d'un récent article de blog de **Bruce Schneier** a suscité une discussion sur la stéganographie et son efficacité contre les **LLM** modernes. Plusieurs commentateurs ont exploré différentes techniques pour dissimuler des informations dans du texte. Voici un aperçu des points clés :
### Techniques de dissimulation simples
Un commentateur a suggéré une approche directe : utiliser du texte blanc sur fond blanc pour dissimuler des informations à l'œil humain tout en restant lisible par machine. Un autre a mentionné l'utilisation de caractères noirs sur fond noir, établissant un parallèle avec les tactiques de censure.
### Échapper aux LLM avec des changements phonologiques
**Derek Jones** a décrit ses tentatives pour obscurcir le sens des **LLM** en introduisant des changements phonologiques dans les mots. Il a présenté une phrase d'exemple avec des fautes d'orthographe délibérées, comme "phashyon es cycklyq." Bien qu'il ait anticipé que la tokenisation des mots gênerait le décodage par les **LLM**, il a constaté que même les modèles plus petits pouvaient gérer ces altérations avec une relative facilité.
### Le problème de la superposition
**Clive Robinson** a souligné que le choix de la couche linguistique pour la stéganographie est crucial. Les couches supérieures (longueurs de tokens plus importantes) donnent un stégo-texte plus cohérent mais peuvent entraîner des sauts de contexte notables. Il a également noté que les concepts sous-jacents ne sont pas nouveaux et ont été discutés précédemment.
### Polices TEMPEST et Soft Tempest
La discussion s'est étendue pour inclure TEMPEST (Transient Electromagnetic Emanation Standard) et les techniques d'atténuation des fuites d'informations par rayonnement électromagnétique. Les commentateurs ont mentionné "Zero Emission Pad", un ancien programme Windows conçu pour contrer les vulnérabilités TEMPEST via le lissage des polices. **Clive Robinson** a cité les travaux de **Markus G. Kuhn** aux Cambridge Computer Labs sur les polices Soft Tempest et a fourni un lien vers une FAQ sur le sujet. Il a averti que la technologie SDR (Software Defined Radio) moderne a considérablement fait progresser les capacités TEMPEST, diminuant potentiellement l'efficacité des anciennes approches basées sur les polices.
### Outils et ressources
Plusieurs outils et ressources ont été mentionnés, notamment :
* `snowdrop`: Un outil disponible dans Debian pour le tatouage de texte anglais en clair.
* `Tempest for Eliza`: Un programme gratuit/open-source démontrant l'insécurité des moniteurs en diffusant sur la radio AM/FM locale.
* `TempestSDR`: Un programme pour utilisateurs avancés utilisant la technologie SDR.
### LLM : Autocomplétion hypertrophiée ?
Un commentateur, **MrC**, a observé avec humour que l'article référencé semble passer d'une méthode de stéganographie astucieuse à la réalisation que les **LLM** sont essentiellement des systèmes d'autocomplétion avancés manquant d'intelligence ou d'intention réelles.
En conclusion, bien que diverses techniques stéganographiques existent, leur efficacité contre les **LLM** modernes et les technologies de surveillance avancées reste un sujet de débat et de développement continus. Les commentaires soulignent le jeu constant du chat et de la souris entre ceux qui cherchent à dissimuler des informations et ceux qui cherchent à les extraire.