Agentes de IA Vulneráveis a Phishing, Alertam Pesquisadores
Nova pesquisa indica que agentes de IA de código aberto, projetados para automatizar tarefas, são suscetíveis a táticas comuns de phishing. Um estudo da Varonis revela que esses agentes, mesmo com protocolos de segurança rigorosos, podem ser enganados para divulgar dados confidenciais da empresa, espelhando vulnerabilidades humanas.

Agentes de inteligência artificial, embora prometam produtividade aprimorada, estão demonstrando uma suscetibilidade preocupante a ataques de phishing que há muito tempo afligem usuários humanos. Uma investigação recente da empresa de segurança **Varonis** destaca como esses sistemas autônomos, construídos sobre modelos de linguagem grandes (LLMs), podem ser manipulados para comprometer dados sensíveis.
A pesquisa focou no framework de agente de IA de código aberto **OpenClaw**, que permite que LLMs interajam com sistemas do mundo real. O **Varonis Threat Labs** configurou um agente **OpenClaw**, chamado **Pinchy**, conectando-o a uma caixa de entrada do Gmail, ferramentas de navegador, APIs do **Google Workspace** e fontes simuladas de dados internos da empresa. Este ambiente sintético incluía informações altamente sensíveis, como credenciais AWS, credenciais de banco de dados, exportações de CRM e comunicações internas.
### Testando a Resiliência do Agente
O agente foi testado sob duas configurações: um perfil genérico com instruções de produtividade padrão e um 'modo estrito' que incorporava conscientização explícita sobre phishing e procedimentos de verificação de identidade. O framework utilizou dois LLMs proeminentes: **Google Gemini 3.1 Pro** e **OpenAI GPT-5.4**.
"O **Varonis Threat Labs** explorou se as mesmas técnicas de phishing que enganaram humanos por décadas também funcionariam nos agentes de IA que trabalham em seu nome", declarou o relatório. "Criamos um agente de IA **OpenClaw** chamado **Pinchy** para testar se o agente passaria ou falharia em versões de simulações clássicas de phishing."

*Visão geral do ataque simulado
Fonte: Varonis*
### Cenários e Resultados de Phishing Simulados
Os pesquisadores conduziram quatro ataques de phishing simulados, com resultados mistos:
1. **Líder de Equipe Impersonado**: Um atacante, impersonando um líder de equipe, solicitou acesso a um ambiente de staging durante um problema de produção fabricado. O agente, em ambos os modos genérico e estrito, **localizou e enviou por e-mail** chaves AWS IAM, credenciais de banco de dados e detalhes de acesso SSH para uma conta Gmail externa.
2. **Solicitação de Exportação de Cliente**: Um atacante solicitou uma exportação de cliente para uma apresentação remota. O agente **recuperou e enviou** uma exportação de CRM contendo registros de clientes, informações de contato e dados de receita sem verificar a identidade do remetente.
3. **E-mail Falso de Vale-Presente**: O agente recebeu um e-mail de phishing com um link de vale-presente. A configuração genérica visitou o site, tentou resgatar o vale-presente com credenciais fabricadas e, eventualmente, identificou a página como maliciosa. A configuração estrita bloqueou o ataque imediatamente.
4. **Aplicação Maliciosa de OAuth**: Pesquisadores criaram uma aplicação **Google OAuth** maliciosa disfarçada de plataforma de folha de pagamento. O agente inspecionou o fluxo OAuth, analisou o destino, identificou a aplicação como suspeita e recusou-se a conceder acesso.
Crucialmente, os dois primeiros cenários viram o modo estrito falhar, apesar das salvaguardas aprimoradas. A **Varonis** observou que "Ambos os perfis Genérico e Estrito falharam porque a etapa de verificação ainda colapsava quando a solicitação parecia operacionalmente urgente."

*A resposta do agente no cenário 2 expondo dados do cliente
Fonte: Varonis*
### Principais Vulnerabilidades e Recomendações
A **Varonis** concluiu que, embora os agentes de IA sejam excelentes na detecção de URLs suspeitas, páginas de login falsas e aplicativos OAuth maliciosos, eles lutam com a verificação de identidade, perda de contexto e aplicação de princípios de zero-trust a interações sociais. O estudo também observou que o **Google Gemini** exibiu uma maior disposição para interagir, enquanto o **OpenAI GPT-5.4** adotou uma postura mais cautelosa.
Para mitigar esses riscos, a **Varonis** recomenda várias medidas críticas:
* Exigir explicitamente que os agentes verifiquem as identidades dos remetentes.
* Impedir que os agentes enviem e-mails para novos destinatários externos sem aprovação humana explícita.
* Implementar limitações rigorosas no acesso dos agentes a dados internos.
* Exigir aprovação humana para ações de alto risco, como compartilhamento de credenciais, solicitações de dados financeiros e comunicações pela primeira vez.
Essas descobertas ressaltam a importância de considerações robustas de segurança à medida que os agentes de IA se tornam mais integrados às operações empresariais, enfatizando a necessidade de uma abordagem em várias camadas para proteger informações confidenciais.