OpenAI déploie le 'Mode Verrouillage' pour ChatGPT afin de contrer l'injection de prompts et l'exfiltration de données
OpenAI a commencé à déployer un nouveau 'Mode Verrouillage' sur divers plans ChatGPT, visant à renforcer la sécurité des données contre la menace persistante des attaques par injection de prompts. Ce paramètre avancé optionnel est conçu principalement pour les utilisateurs et les organisations manipulant des informations sensibles, réduisant considérablement les voies d'exfiltration de données en limitant les requêtes réseau sortantes et les connexions externes.

**OpenAI** a introduit le **Mode Verrouillage** pour **ChatGPT**, une fonctionnalité de sécurité avancée visant à atténuer les risques d'exfiltration de données découlant des attaques par injection de prompts. Ce déploiement stratégique cible les comptes personnels sur les plans Free, Go, Plus, Pro et **ChatGPT Business** en libre-service, offrant une protection renforcée pour les données sensibles.
### Comprendre l'objectif du Mode Verrouillage
Le **Mode Verrouillage** est un paramètre d'activation volontaire conçu pour restreindre bon nombre des outils et capacités d'**OpenAI** qui interagissent avec le web ou des services externes. **OpenAI** a déclaré : « Il est conçu pour réduire le risque d'exfiltration de données due aux attaques par injection de prompts en limitant les requêtes réseau sortantes, au détriment de la désactivation ou de la limitation de certaines fonctionnalités utiles. »
Cette initiative aborde directement l'injection de prompts, un problème « de pointe » qui continue de poser des défis à la sécurité de tous les grands modèles linguistiques (**LLM**). En s'appuyant sur les mécanismes de sandboxing et les contrôles existants, le mode cible spécifiquement les **mécanismes d'exfiltration de données basés sur les URL**, empêchant les informations sensibles d'être transmises à une infrastructure contrôlée par un attaquant.
### Fonctionnalités désactivées pour une sécurité accrue
L'idée principale derrière le **Mode Verrouillage** n'est pas d'empêcher complètement les injections de prompts, ni de modifier le fonctionnement de la mémoire ou des téléchargements de fichiers. Son objectif est plutôt d'éliminer les voies potentielles d'exfiltration de données. Pour ce faire, plusieurs fonctionnalités sont désactivées :
* **Navigation web en direct** : Limitée à l'accès uniquement au contenu mis en cache.
* **Support d'images** : Empêche l'affichage d'images dans les réponses ou leur récupération sur le web.
* **Recherche approfondie**.
* **Mode Agent**.
* **Réseau Canvas** : Bloque l'approbation par l'utilisateur du code généré par **Canvas** pour accéder au réseau.
* **Téléchargements de fichiers** : Empêche le téléchargement de fichiers pour l'analyse de données.
### Mises en garde et limitations importantes
**OpenAI** souligne que le **Mode Verrouillage** n'est pas destiné à tous les utilisateurs. Il ne peut pas être utilisé simultanément avec le **Mode Développeur** ; l'activation de l'un désactivera l'autre.
De plus, bien que réduisant considérablement le risque, le **Mode Verrouillage** n'offre pas une garantie complète contre l'exfiltration de données. **OpenAI** a reconnu : « Le risque peut subsister via les Applications activées, des combinaisons imprévues de capacités, ou des techniques nouvellement découvertes. » L'entreprise a également précisé que le mode n'empêche pas tous les autres effets des attaques par injection de prompts, tels que les instructions malveillantes cachées dans les fichiers téléchargés influençant le comportement de **ChatGPT** et conduisant potentiellement à des réponses incorrectes.
### Améliorations de sécurité plus larges
Dans un développement connexe, **OpenAI** a également lancé une nouvelle fonctionnalité de gestion de compte pour **ChatGPT**. Celle-ci permet aux utilisateurs de consulter les sessions actives, de se déconnecter de sessions individuelles ou de toutes les sessions, et d'identifier tout signe d'activité de compte non autorisée. Les informations de session comprennent des détails tels que l'appareil, l'application utilisée, la localisation approximative, la date et l'heure de connexion, et si l'appareil est fiable ou représente la session actuelle.