El Mito de Anthropic: IA Armando Vulnerabilidades Autónomamente - ¿Una Nueva Era para la Ciberseguridad?
**Anthropic** presentó recientemente **Claude Mythos Preview**, un modelo de IA capaz de descubrir y explotar vulnerabilidades de software de forma autónoma. Aunque no ha sido lanzado públicamente, este desarrollo ha encendido el debate en la comunidad de ciberseguridad sobre el papel cambiante de la IA tanto en ataque como en defensa.
Hace dos semanas, **Anthropic** anunció que su nuevo modelo, **Claude Mythos Preview**, puede encontrar y armar vulnerabilidades de software de forma autónoma, convirtiéndolas en exploits funcionales sin guía experta. Se trataba de vulnerabilidades en software clave como sistemas operativos e infraestructura de internet que miles de desarrolladores de software trabajando en esos sistemas no lograron encontrar. Esta capacidad tendrá importantes implicaciones de seguridad, comprometiendo los dispositivos y servicios que usamos a diario. Como resultado, **Anthropic** no está lanzando el modelo al público general, sino a un número limitado de empresas.
La noticia sacudió a la comunidad de seguridad en internet. Hubo pocos detalles en el anuncio de **Anthropic**, lo que enfureció a muchos observadores. Algunos especulan que **Anthropic** no tiene las GPUs necesarias para ejecutarlo, y que la ciberseguridad fue la excusa para limitar su lanzamiento. Otros argumentan que **Anthropic** se mantiene fiel a su misión de seguridad en IA. Hay exageración y contra-exageración, realidad y marketing. Es mucho que procesar, incluso para un experto.
Vemos a Mythos como un paso real pero incremental, uno en una larga serie de pasos incrementales. Pero incluso los pasos incrementales pueden ser importantes cuando miramos el panorama general.
### Cómo la IA Está Cambiando la Ciberseguridad
Hemos escrito sobre el síndrome de la línea de base cambiante, un fenómeno que lleva a las personas —tanto al público como a los expertos— a descartar cambios masivos a largo plazo que están ocultos en pasos incrementales. Ha sucedido con la privacidad en línea, y está sucediendo con la IA. Incluso si las vulnerabilidades encontradas por Mythos pudieran haber sido encontradas usando modelos de IA del mes pasado o del año pasado, no podrían haber sido encontradas por modelos de IA de hace cinco años.
El anuncio de Mythos nos recuerda que la IA ha avanzado mucho en solo unos pocos años: la línea de base realmente ha cambiado. Encontrar vulnerabilidades en el código fuente es el tipo de tarea en la que los modelos de lenguaje grandes de hoy en día sobresalen. Independientemente de si sucedió el año pasado o sucederá el próximo año, ha sido claro por un tiempo que este tipo de capacidad estaba por llegar. La pregunta es cómo nos adaptamos a ella.
No creemos que una IA que pueda hackear de forma autónoma cree una asimetría permanente entre ataque y defensa; es probable que sea más matizado que eso. Algunas vulnerabilidades pueden ser encontradas, verificadas y parcheadas automáticamente. Algunas vulnerabilidades serán difíciles de encontrar pero fáciles de verificar y parchear —consideremos aplicaciones web genéricas alojadas en la nube construidas sobre pilas de software estándar, donde las actualizaciones se pueden implementar rápidamente. Otras serán fáciles de encontrar (incluso sin IA potente) y relativamente fáciles de verificar, pero más difíciles o imposibles de parchear, como los dispositivos IoT y equipos industriales que rara vez se actualizan o no se pueden modificar fácilmente.
Luego están los sistemas cuyas vulnerabilidades serán fáciles de encontrar en el código pero difíciles de verificar en la práctica. Por ejemplo, los sistemas distribuidos complejos y las plataformas en la nube pueden estar compuestos por miles de servicios interactivos ejecutándose en paralelo, lo que dificulta distinguir las vulnerabilidades reales de los falsos positivos y reproducirlas de manera confiable.
Por lo tanto, debemos separar lo parcheable de lo no parcheable, y lo fácil de verificar de lo difícil de verificar. Esta taxonomía también nos proporciona orientación sobre cómo proteger dichos sistemas en una era de potentes herramientas de IA para encontrar vulnerabilidades.
Los sistemas no parcheables o difíciles de verificar deben protegerse envolviéndolos en capas más restrictivas y estrictamente controladas. Quieres que tu refrigerador, termostato o sistema de control industrial esté detrás de un firewall restrictivo y constantemente actualizado, no hablando libremente con internet.
Los sistemas distribuidos que están fundamentalmente interconectados deben ser rastreables y deben seguir el principio de mínimo privilegio, donde cada componente tiene solo el acceso que necesita. Estas son ideas de seguridad estándar que podríamos haber tentado descartar en la era de la IA, pero siguen siendo tan relevantes como siempre.
### Repensando las Prácticas de Seguridad de Software
Esto también aumenta la importancia de las mejores prácticas en ingeniería de software. Las pruebas automatizadas, exhaustivas y continuas siempre fueron importantes. Ahora podemos llevar esta práctica un paso más allá y usar agentes de IA defensivos para probar exploits contra una pila real, una y otra vez, hasta que se eliminen los falsos positivos y se confirmen las vulnerabilidades y correcciones reales. Este tipo de VulnOps probablemente se convertirá en una parte estándar del proceso de desarrollo.
La documentación se vuelve más valiosa, ya que puede guiar a un agente de IA en una misión de búsqueda de errores, al igual que lo hace con los desarrolladores. Y seguir prácticas estándar y usar herramientas y bibliotecas estándar permite que tanto la IA como los ingenieros reconozcan patrones de manera más efectiva, incluso en un mundo de software instantáneo individual y efímero —código que se puede generar y desplegar bajo demanda.
¿Favorecerá esto al ataque o a la defensa? A la defensa eventualmente, probablemente, especialmente en sistemas que son fáciles de parchear y verificar. Afortunadamente, eso incluye nuestros teléfonos, navegadores web y los principales servicios de internet. Pero los autos de hoy, los transformadores eléctricos, los refrigeradores y las farolas están conectados a internet. Los sistemas bancarios y de aerolíneas heredados están en red.
No todos esos se parchearán tan rápido como sea necesario, y podemos ver unos años de hackeos constantes hasta que lleguemos a una nueva normalidad: donde la verificación es primordial y el software se parchea continuamente.
*Este ensayo fue escrito con Barath Raghavan, y apareció originalmente en [IEEE Spectrum](https://spectrum.ieee.org/ai-cybersecurity-mythos).*