OpenAI lanza el 'Modo de Bloqueo' para ChatGPT para frustrar la inyección de prompts y la exfiltración de datos
OpenAI ha comenzado a implementar un nuevo 'Modo de Bloqueo' en varios planes de ChatGPT, con el objetivo de fortalecer la seguridad de los datos contra la persistente amenaza de los ataques de inyección de prompts. Esta configuración avanzada opcional está diseñada principalmente para usuarios y organizaciones que manejan información sensible, reduciendo significativamente las vías para la exfiltración de datos al limitar las solicitudes de red salientes y las conexiones externas.

**OpenAI** ha introducido el **Modo de Bloqueo** para **ChatGPT**, una función de seguridad avanzada destinada a mitigar los riesgos de exfiltración de datos derivados de los ataques de inyección de prompts. Este despliegue estratégico se dirige a cuentas personales en los planes Free, Go, Plus, Pro y ChatGPT Business de autoservicio, proporcionando una protección mejorada para los datos sensibles.
### Entendiendo el Propósito del Modo de Bloqueo
El **Modo de Bloqueo** es una configuración opcional diseñada para restringir muchas de las herramientas y capacidades de **OpenAI** que interactúan con la web o servicios externos. **OpenAI** declaró: "Está diseñado para reducir el riesgo de exfiltración de datos de ataques de inyección de prompts al limitar las solicitudes de red salientes, a expensas de deshabilitar o limitar algunas funciones útiles".
La iniciativa aborda directamente la inyección de prompts, un problema "de vanguardia" que continúa desafiando la seguridad de todos los modelos de lenguaje grandes (**LLMs**). Al basarse en el sandboxing y los controles existentes, el modo se dirige específicamente a los **mecanismos de exfiltración de datos basados en URL**, impidiendo que la información sensible se transmita a infraestructura controlada por el atacante.
### Funciones Deshabilitadas para Mayor Seguridad
La idea central detrás del **Modo de Bloqueo** no es prevenir por completo las inyecciones de prompts, ni altera el funcionamiento de la memoria o las cargas de archivos. En cambio, su objetivo es eliminar las vías potenciales para la exfiltración de datos. Para lograr esto, se deshabilitan varias funciones:
* **Navegación web en vivo**: Limitada al acceso solo de contenido en caché.
* **Soporte de imágenes**: Impide mostrar imágenes en las respuestas o recuperarlas de la web.
* **Investigación profunda**.
* **Modo Agente**.
* **Red Canvas**: Bloquea la aprobación del usuario para que el código generado por **Canvas** acceda a la red.
* **Descargas de archivos**: Impide la descarga de archivos para análisis de datos.
### Advertencias y Limitaciones Importantes
**OpenAI** enfatiza que el **Modo de Bloqueo** no está destinado a todos los usuarios. No se puede usar simultáneamente con el **Modo de Desarrollador**; activar uno deshabilitará el otro.
Además, si bien reduce significativamente el riesgo, el **Modo de Bloqueo** no ofrece una garantía completa contra la exfiltración de datos. **OpenAI** reconoció: "El riesgo puede permanecer a través de las Aplicaciones habilitadas, combinaciones imprevistas de capacidades o técnicas recién descubiertas". La compañía también aclaró que el modo no previene todos los demás efectos de los ataques de inyección de prompts, como instrucciones maliciosas ocultas en archivos cargados que influyen en el comportamiento de **ChatGPT** y potencialmente conducen a respuestas incorrectas.
### Mejoras de Seguridad Más Amplias
En un desarrollo relacionado, **OpenAI** también ha lanzado una nueva función de administración de cuentas para **ChatGPT**. Esto permite a los usuarios revisar sesiones activas, cerrar sesión en sesiones individuales o en todas, e identificar cualquier signo de actividad de cuenta no autorizada. La información de la sesión incluye detalles como el dispositivo, la aplicación utilizada, la ubicación aproximada, la fecha y hora de inicio de sesión, y si el dispositivo es de confianza o representa la sesión actual.