Steganografie und LLMs: Versteckt im Offensichtlichen?
Kommentare auf dem Blog von **Bruce Schneier** diskutieren Methoden der Steganografie, darunter die Verwendung von weißem Text auf weißem Hintergrund und phonologische Änderungen an Wörtern, um der Erkennung durch **Large Language Models (LLMs)** zu entgehen. Die Diskussion berührt die Grenzen und potenziellen Umgehungen dieser Techniken sowie verwandte Werkzeuge zur TEMPEST-Minderung und Text-Wasserzeichen.
Die Kommentarspalte eines aktuellen Blogbeitrags von **Bruce Schneier** hat eine Diskussion über Steganografie und ihre Wirksamkeit gegen moderne **LLMs** ausgelöst. Mehrere Kommentatoren untersuchten verschiedene Techniken zur Verschleierung von Informationen in Texten. Hier ist eine Aufschlüsselung der wichtigsten Punkte:
### Einfache Verstecktechniken
Ein Kommentator schlug einen einfachen Ansatz vor: die Verwendung von weißem Text auf weißem Hintergrund, um Informationen vor dem menschlichen Auge zu verbergen und gleichzeitig maschinenlesbar zu bleiben. Ein anderer erwähnte die Verwendung von schwarzer Schrift auf schwarzem Hintergrund und zog eine Parallele zu Zensurtaktiken.
### LLMs mit phonologischen Änderungen umgehen
**Derek Jones** beschrieb seine Versuche, die Bedeutung für **LLMs** zu verschleiern, indem er phonologische Änderungen an Wörtern vornahm. Er präsentierte einen Beispielsatz mit absichtlichen Rechtschreibfehlern wie „phashyon es cycklyq“. Obwohl er erwartete, dass die Wort-Tokenisierung die **LLM**-Dekodierung behindern würde, stellte er fest, dass selbst kleinere Modelle diese Änderungen relativ leicht bewältigen konnten.
### Das Problem der Schichtung
**Clive Robinson** betonte, dass die Wahl der Sprachebene für die Steganografie entscheidend ist. Höhere Ebenen (längere Token-Längen) ergeben kohärenteren Stego-Text, können aber zu bemerkenswerten Kontextsprüngen führen. Er bemerkte auch, dass die zugrunde liegenden Konzepte nicht neu sind und bereits zuvor diskutiert wurden.
### TEMPEST und Soft Tempest Fonts
Die Diskussion erweiterte sich auf TEMPEST (Transient Electromagnetic Emanation Standard) und Techniken zur Minderung von Informationslecks durch elektromagnetische Strahlung. Kommentatoren erwähnten „Zero Emission Pad“, ein älteres Windows-Programm zur Abwehr von TEMPEST-Schwachstellen durch Font-Glättung. **Clive Robinson** zitierte die Arbeit von **Markus G. Kuhn** am Cambridge Computer Labs zu Soft Tempest Fonts und verlinkte zu einer FAQ zu diesem Thema. Er warnte, dass moderne SDR-Technologie (Software Defined Radio) die TEMPEST-Fähigkeiten erheblich verbessert hat und die Wirksamkeit älterer, auf Schriftarten basierender Ansätze potenziell verringert.
### Werkzeuge und Ressourcen
Mehrere Werkzeuge und Ressourcen wurden erwähnt, darunter:
* `snowdrop`: Ein Werkzeug, das in Debian für das Wasserzeichen von englischem Klartext verfügbar ist.
* `Tempest for Eliza`: Ein kostenloses Open-Source-Programm, das die Unsicherheit von Monitoren demonstriert, indem es auf lokales AM/FM-Radio sendet.
* `TempestSDR`: Ein Programm für fortgeschrittene Benutzer, das SDR-Technologie nutzt.
### LLMs: Überdimensionierte Autovervollständigung?
Ein Kommentator, **MrC**, beobachtete humorvoll, dass das zitierte Papier scheinbar von einer cleveren Steganografie-Methode zu der Erkenntnis übergeht, dass **LLMs** im Wesentlichen fortschrittliche Autovervollständigungssysteme sind, denen es an echter Intelligenz oder Absicht mangelt.
Zusammenfassend lässt sich sagen, dass es zwar verschiedene steganografische Techniken gibt, ihre Wirksamkeit gegen moderne **LLMs** und fortschrittliche Überwachungstechnologien jedoch Gegenstand laufender Debatten und Entwicklungen bleibt. Die Kommentare unterstreichen das ständige Katz-und-Maus-Spiel zwischen denen, die Informationen verbergen wollen, und denen, die sie extrahieren wollen.