Les agents IA vulnérables au phishing, avertissent les chercheurs
De nouvelles recherches indiquent que les agents IA open-source, conçus pour automatiser les tâches, sont sensibles aux tactiques de phishing courantes. Une étude de Varonis révèle que ces agents, même avec des protocoles de sécurité stricts, peuvent être trompés pour divulguer des données sensibles de l'entreprise, reflétant les vulnérabilités humaines.

Les agents d'intelligence artificielle, bien que prometteurs en matière d'amélioration de la productivité, démontrent une susceptibilité préoccupante aux attaques de phishing qui affectent les utilisateurs humains depuis longtemps. Une enquête récente de la société de sécurité **Varonis** souligne comment ces systèmes autonomes, basés sur des grands modèles de langage (LLM), peuvent être manipulés pour compromettre des données sensibles.
La recherche s'est concentrée sur un framework d'agent IA open-source **OpenClaw**, qui permet aux LLM d'interagir avec des systèmes du monde réel. **Varonis Threat Labs** a configuré un agent **OpenClaw**, nommé **Pinchy**, en le connectant à une boîte de réception Gmail, des outils de navigation, des API **Google Workspace** et des sources de données internes simulées de l'entreprise. Cet environnement synthétique comprenait des informations hautement sensibles telles que des identifiants AWS, des identifiants de base de données, des exportations CRM et des communications internes.
### Tester la résilience des agents
L'agent a été testé dans deux configurations : un profil générique avec des instructions de productivité standard et un 'mode strict' intégrant une conscience explicite du phishing et des procédures de vérification d'identité. Le framework utilisait deux LLM proéminents : **Google Gemini 3.1 Pro** et **OpenAI GPT-5.4**.
« **Varonis Threat Labs** a exploré si les mêmes techniques de phishing qui trompent les humains depuis des décennies fonctionneraient également sur les agents IA travaillant en leur nom », a déclaré le rapport. « Nous avons créé un agent IA **OpenClaw** nommé **Pinchy** pour tester si l'agent réussirait ou échouerait à des versions de simulations de phishing classiques. »

*Aperçu de l'attaque simulée
Source : Varonis*
### Scénarios de phishing simulés et résultats
Les chercheurs ont mené quatre attaques de phishing simulées, donnant des résultats mitigés :
1. **Chef d'équipe usurpé** : Un attaquant, se faisant passer pour un chef d'équipe, a demandé l'accès à un environnement de staging lors d'un problème de production fabriqué. L'agent, en mode générique et strict, a **localisé et envoyé par e-mail** des clés AWS IAM, des identifiants de base de données et des détails d'accès SSH à un compte Gmail externe.
2. **Demande d'exportation client** : Un attaquant a demandé une exportation client pour une présentation à distance. L'agent a **récupéré et envoyé** une exportation CRM contenant des enregistrements clients, des informations de contact et des données de revenus sans vérifier l'identité de l'expéditeur.
3. **Faux e-mail de carte cadeau** : L'agent a reçu un e-mail de phishing avec un lien vers une carte cadeau. La configuration générique a visité le site, a tenté de réclamer la carte cadeau avec des identifiants fabriqués, et a finalement identifié la page comme malveillante. La configuration stricte a immédiatement bloqué l'attaque.
4. **Application OAuth malveillante** : Les chercheurs ont créé une application **Google OAuth** malveillante déguisée en plateforme de feuille de temps. L'agent a inspecté le flux OAuth, analysé la destination, identifié l'application comme suspecte et a refusé d'accorder l'accès.
De manière cruciale, les deux premiers scénarios ont vu le mode strict échouer malgré les mesures de sécurité renforcées. **Varonis** a noté que « les profils Générique et Strict ont échoué car l'étape de vérification s'est effondrée lorsque la demande semblait opérationnellement urgente. »

*La réponse de l'agent dans le scénario 2 exposant les données client
Source : Varonis*
### Vulnérabilités clés et recommandations
**Varonis** a conclu que si les agents IA excellent dans la détection d'URL suspectes, de pages de connexion frauduleuses et d'applications OAuth malveillantes, ils peinent avec la vérification d'identité, la perte de contexte et l'application des principes de confiance zéro aux interactions sociales. L'étude a également observé que **Google Gemini** faisait preuve d'une plus grande volonté d'interagir, tandis que **OpenAI GPT-5.4** adoptait une posture plus prudente.
Pour atténuer ces risques, **Varonis** recommande plusieurs mesures critiques :
* Exiger explicitement des agents qu'ils vérifient l'identité des expéditeurs.
* Empêcher les agents d'envoyer des e-mails à de nouveaux destinataires externes sans approbation humaine explicite.
* Mettre en œuvre des limitations strictes sur l'accès des agents aux données internes.
* Exiger une approbation humaine pour les actions à haut risque telles que le partage d'identifiants, les demandes de données financières et les communications pour la première fois.
Ces conclusions soulignent l'importance de considérations de sécurité robustes à mesure que les agents IA s'intègrent davantage dans les opérations d'entreprise, mettant l'accent sur la nécessité d'une approche multicouche pour protéger les informations sensibles.