Anthropic's Mythos: KI waffnet Schwachstellen autonom – Eine neue Ära für Cybersicherheit?
**Anthropic** hat kürzlich **Claude Mythos Preview** vorgestellt, ein KI-Modell, das autonom Software-Schwachstellen entdecken und ausnutzen kann. Obwohl es nicht öffentlich freigegeben wurde, hat diese Entwicklung eine Debatte in der Cybersicherheits-Community über die sich entwickelnde Rolle von KI in Offensive und Defensive ausgelöst.
Vor zwei Wochen kündigte **Anthropic** an, dass sein neues Modell, **Claude Mythos Preview**, autonom Software-Schwachstellen finden und waffnen kann, indem es sie ohne Expertenanleitung in funktionierende Exploits umwandelt. Es handelte sich um Schwachstellen in wichtiger Software wie Betriebssystemen und Internet-Infrastruktur, die Tausende von Softwareentwicklern, die an diesen Systemen arbeiten, nicht finden konnten. Diese Fähigkeit wird erhebliche Sicherheitsauswirkungen haben und die Geräte und Dienste kompromittieren, die wir täglich nutzen. Daher veröffentlicht **Anthropic** das Modell nicht für die breite Öffentlichkeit, sondern stattdessen für eine begrenzte Anzahl von Unternehmen.
Die Nachricht erschütterte die Internet-Sicherheits-Community. In **Anthropic's** Ankündigung gab es nur wenige Details, was viele Beobachter verärgerte. Einige spekulieren, dass **Anthropic** nicht über die GPUs verfügt, um das Ding auszuführen, und dass Cybersicherheit die Ausrede war, um die Veröffentlichung einzuschränken. Andere argumentieren, dass **Anthropic** an seiner KI-Sicherheitsmission festhält. Es gibt Hype und Gegen-Hype, Realität und Marketing. Es gibt viel zu sortieren, selbst wenn man Experte ist.
Wir sehen Mythos als einen realen, aber inkrementellen Schritt, einen von vielen inkrementellen Schritten. Aber selbst inkrementelle Schritte können wichtig sein, wenn wir das Gesamtbild betrachten.
### Wie KI die Cybersicherheit verändert
Wir haben über das Phänomen des "shifting baseline syndrome" geschrieben, das dazu führt, dass Menschen – sowohl die Öffentlichkeit als auch Experten – massive langfristige Veränderungen, die sich in inkrementellen Schritten verbergen, abtun. Es ist bei der Online-Privatsphäre passiert und geschieht jetzt mit KI. Selbst wenn die von Mythos gefundenen Schwachstellen mit KI-Modellen vom letzten Monat oder letztem Jahr hätten gefunden werden können, hätten sie mit KI-Modellen von vor fünf Jahren nicht gefunden werden können.
Die Mythos-Ankündigung erinnert uns daran, dass KI in nur wenigen Jahren einen langen Weg zurückgelegt hat: Die Basis hat sich wirklich verschoben. Das Finden von Schwachstellen im Quellcode ist eine Aufgabe, bei der heutige große Sprachmodelle hervorragend abschneiden. Unabhängig davon, ob es letztes Jahr passiert ist oder nächstes Jahr passieren wird, war es seit einiger Zeit klar, dass diese Art von Fähigkeit bald kommen würde. Die Frage ist, wie wir uns darauf einstellen.
Wir glauben nicht, dass eine KI, die autonom hacken kann, eine permanente Asymmetrie zwischen Offensive und Defensive schaffen wird; es wird wahrscheinlich nuancierter sein. Einige Schwachstellen können automatisch gefunden, verifiziert und behoben werden. Einige Schwachstellen werden schwer zu finden, aber leicht zu verifizieren und zu beheben sein – denken Sie an generische cloud-gehostete Webanwendungen, die auf Standard-Software-Stacks basieren, bei denen Updates schnell bereitgestellt werden können. Wieder andere werden leicht zu finden (auch ohne leistungsstarke KI) und relativ leicht zu verifizieren sein, aber schwieriger oder unmöglich zu beheben, wie z. B. IoT-Geräte und Industrieanlagen, die selten aktualisiert werden oder nicht einfach modifiziert werden können.
Dann gibt es Systeme, deren Schwachstellen im Code leicht zu finden, aber in der Praxis schwer zu verifizieren sind. Komplexe verteilte Systeme und Cloud-Plattformen können beispielsweise aus Tausenden von interagierenden Diensten bestehen, die parallel laufen, was es schwierig macht, echte Schwachstellen von Fehlalarmen zu unterscheiden und sie zuverlässig zu reproduzieren.
Wir müssen also das Patchbare vom Unpatchbaren und das leicht zu Verifizierende vom schwer zu Verifizierenden trennen. Diese Taxonomie gibt uns auch Anleitungen, wie wir solche Systeme in einer Ära leistungsstarker KI-Schwachstellen-Findungstools schützen können.
Unpatchbare oder schwer zu verifizierende Systeme sollten geschützt werden, indem sie in restriktivere, eng kontrollierte Schichten eingehüllt werden. Sie möchten, dass Ihr Kühlschrank, Thermostat oder industrielle Steuerungssystem hinter einer restriktiven und ständig aktualisierten Firewall liegt und nicht frei mit dem Internet spricht.
Verteilte Systeme, die grundlegend miteinander verbunden sind, sollten nachvollziehbar sein und dem Prinzip der geringsten Rechte folgen, bei dem jede Komponente nur den Zugriff hat, den sie benötigt. Dies sind Standard-Sicherheitsideen, die wir in der Ära der KI vielleicht verworfen hätten, aber sie sind immer noch so relevant wie eh und je.
### Überdenken von Software-Sicherheitspraktiken
Dies erhöht auch die Bedeutung von Best Practices in der Softwareentwicklung. Automatisierte, gründliche und kontinuierliche Tests waren schon immer wichtig. Jetzt können wir diese Praxis einen Schritt weiter gehen und defensive KI-Agenten verwenden, um Exploits wiederholt gegen einen echten Stack zu testen, bis die Fehlalarme aussortiert sind und die echten Schwachstellen und Korrekturen bestätigt sind. Diese Art von VulnOps wird wahrscheinlich zu einem Standardbestandteil des Entwicklungsprozesses.
Dokumentation wird wertvoller, da sie einen KI-Agenten auf einer Bug-Finding-Mission leiten kann, genauso wie sie Entwickler leitet. Und die Einhaltung von Standardpraktiken und die Verwendung von Standardwerkzeugen und Bibliotheken ermöglichen es KI und Ingenieuren gleichermaßen, Muster effektiver zu erkennen, selbst in einer Welt individueller und kurzlebiger Sofortsoftware – Code, der bei Bedarf generiert und bereitgestellt werden kann.
Wird dies die Offensive oder die Defensive begünstigen? Wahrscheinlich letztendlich die Defensive, insbesondere bei Systemen, die leicht zu patchen und zu verifizieren sind. Glücklicherweise gehören dazu unsere Telefone, Webbrowser und wichtigen Internetdienste. Aber heutige Autos, elektrische Transformatoren, Kühlschränke und Laternenpfähle sind mit dem Internet verbunden. Legacy-Banken- und Flugsysteme sind vernetzt.
Nicht all diese werden so schnell wie nötig gepatcht werden, und wir könnten ein paar Jahre ständiger Hacks erleben, bis wir zu einem neuen Normalzustand gelangen: wo Verifizierung an erster Stelle steht und Software kontinuierlich gepatcht wird.
*Dieser Aufsatz wurde mit Barath Raghavan verfasst und erschien ursprünglich in [IEEE Spectrum](https://spectrum.ieee.org/ai-cybersecurity-mythos).*