Esteganografia e LLMs: Escondendo à Vista?
Comentários no blog de **Bruce Schneier** discutem métodos de esteganografia, incluindo o uso de texto branco sobre fundo branco e alterações fonológicas em palavras para evadir a detecção por **Large Language Models (LLMs)**. A discussão aborda as limitações e potenciais contornos dessas técnicas, bem como ferramentas relacionadas para mitigação TEMPEST e marca d'água em texto.
A seção de comentários de uma postagem recente no blog de **Bruce Schneier** gerou uma discussão sobre esteganografia e sua eficácia contra **LLMs** modernos. Vários comentaristas exploraram diferentes técnicas para ocultar informações dentro de textos. Aqui está um resumo dos pontos principais:
### Técnicas Simples de Ocultação
Um comentarista sugeriu uma abordagem direta: usar texto branco sobre fundo branco para ocultar informações do olho humano, mantendo-as legíveis por máquinas. Outro mencionou o uso de fonte preta sobre fundo preto, traçando um paralelo com táticas de censura.
### Evadindo LLMs com Alterações Fonológicas
**Derek Jones** descreveu suas tentativas de obscurecer o significado para **LLMs** introduzindo alterações fonológicas nas palavras. Ele apresentou uma frase de exemplo com erros de ortografia deliberados, como "phashyon es cycklyq". Embora ele esperasse que a tokenização de palavras dificultasse a decodificação do **LLM**, ele descobriu que até mesmo modelos menores conseguiam lidar com essas alterações com relativa facilidade.
### O Problema da Camada
**Clive Robinson** enfatizou que a escolha da camada de linguagem para esteganografia é crucial. Camadas mais altas (comprimentos de token maiores) produzem um texto esteganográfico mais coerente, mas podem resultar em saltos de contexto perceptíveis. Ele também observou que os conceitos subjacentes não são novos e já foram discutidos anteriormente.
### TEMPEST e Fontes Soft Tempest
A discussão se expandiu para incluir TEMPEST (Transient Electromagnetic Emanation Standard) e técnicas para mitigar vazamentos de informações através de radiação eletromagnética. Comentaristas mencionaram "Zero Emission Pad", um programa mais antigo para Windows projetado para combater vulnerabilidades TEMPEST através do suavização de fontes. **Clive Robinson** citou o trabalho de **Markus G. Kuhn** no Cambridge Computer Labs sobre Soft Tempest Fonts e forneceu um link para um FAQ sobre o assunto. Ele alertou que a tecnologia moderna de SDR (Software Defined Radio) avançou significativamente as capacidades TEMPEST, potencialmente diminuindo a eficácia de abordagens mais antigas baseadas em fontes.
### Ferramentas e Recursos
Várias ferramentas e recursos foram mencionados, incluindo:
* `snowdrop`: Uma ferramenta disponível no Debian para marca d'água em texto simples em inglês.
* `Tempest for Eliza`: Um programa gratuito/código aberto que demonstra a insegurança de monitores transmitindo para rádio AM/FM local.
* `TempestSDR`: Um programa para usuários avançados que utiliza tecnologia SDR.
### LLMs: Autocompletar Crescido?
Um comentarista, **MrC**, observou humoristicamente que o artigo referenciado aparentemente transita de um método de esteganografia inteligente para a constatação de que **LLMs** são essencialmente sistemas de autocompletar avançados, sem inteligência ou intenção reais.
Em conclusão, embora existam várias técnicas esteganográficas, sua eficácia contra **LLMs** modernos e tecnologias de vigilância avançadas continua sendo um assunto de debate e desenvolvimento contínuos. Os comentários destacam o constante jogo de gato e rato entre aqueles que buscam ocultar informações e aqueles que buscam extraí-las.