Claude Mythos Preview: Die größte Cybersicherheits-Bedrohung der Welt – Apple, Microsoft und Google handeln bereits. Was ist mit dem Rest?
Anthropic hat am 7. April 2026 ein KI-Modell vorgestellt, das es selbst als zu gefährlich für die Öffentlichkeit einstuft. Gleichzeitig haben die größten Technologieunternehmen der Welt – Apple, Microsoft, Google, Amazon, Cisco, NVIDIA, JPMorganChase, CrowdStrike, Broadcom und Palo Alto Networks – exklusiven Zugang erhalten, um ihre eigenen Systeme damit abzusichern. Das Programm heißt Project Glasswing.
Was das für alle anderen bedeutet – für mittelständische Unternehmen, kleine Hoster, kommunale Verwaltungen, Bankkunden und jeden der Software nutzt – bleibt in der bisherigen Berichterstattung weitgehend unbeantwortet. Ich versuche hier zusammenzufassen, was belegbar ist, was spekulativ bleibt und wie man sich schützen kann.
Was ist Claude Mythos Preview?
Anthropic hat Mythos Preview am 7. April 2026 offiziell angekündigt – nicht als nutzbares Sprachmodell für alle, sondern als Preview zu Forschungszwecken mit ausschließlich einladungsbasiertem Zugang für Cybersicherheits-Firmen und ausgewählte Partner.
Das Modell bildet eine neue Kategorie oberhalb der bisher fähigsten Opus-Linie. Intern trug es den Codenamen „Capybara“. Anthropic beschreibt es als Multi-Use-Modell mit besonderen Stärken in Coding, Reasoning und Cybersicherheit.
Quellen: Anthropic Red Team Blog (red.anthropic.com, 7. April 2026), Anthropic Developer Platform Release Notes (platform.claude.com), Google Cloud Blog (7. April 2026)
Was sagen die Benchmarks?
Die Zahlen stammen aus der offiziellen Anthropic-Dokumentation sowie aus der Auswertung von llm-stats.com:
Auf SWE-bench Verified (Coding-Benchmark) erreicht Mythos Preview 93,9% – Opus 4.6 liegt bei 80,8%. Auf Terminal-Bench 2.0 sind es 82,0% zu 65,4%. Beim GPQA Diamond (Wissenschaft) 94,6% zu 91,3%. Auf Humanity’s Last Exam mit Tools 64,7% zu 53,1%. Beim CyberGym (Cybersicherheit) 83,1% zu 66,6%.
Ein Sprung von 14 Prozentpunkten im Coding ist kein gradueller Fortschritt – das ist ein messbarer Qualitätssprung.
Wichtige Einschränkung: Benchmarks messen definierte Aufgaben unter kontrollierten Bedingungen. Die Übertragbarkeit auf reale Workflows hängt stark vom Anwendungsfall ab.
Was Mythos für den Bereich Cybersicherheit konkret bedeutet
Der Anthropic Red Team Blog dokumentiert nüchtern, was das Modell bereits geleistet hat:
Opus 4.6 konnte bekannte Firefox-Schwachstellen in lediglich 2 von mehreren hundert Versuchen autonom zu funktionierenden Exploits machen. Mythos Preview erreichte dasselbe in 181 von 250 Versuchen – vollständig autonom, ohne menschliche Intervention nach dem initialen Prompt.
Zusätzlich identifizierte Mythos Preview eine 27 Jahre alte Schwachstelle in OpenBSD – einem der als sichersten geltenden Betriebssysteme – sowie eine 16 Jahre alte Lücke in FFmpeg, die automatisierten Werkzeugen über 5 Millionen Testläufe lang entgangen war.
Auf Anthropics eigenem Testsystem wurden rund 7.000 Stellen in echter, weit verbreiteter Software geprüft – so wie man systematisch jedes Fenster und jede Tür eines Gebäudes auf Schwachstellen abklopft. Alle Testsysteme waren vollständig gepatcht, also auf dem neuesten Sicherheitsstand. Opus 4.6 schaffte eine vollständige Systemübernahme. Mythos Preview: zehn.
Das klingt zunächst überschaubar – ist es aber nicht. Denn „vollständig gepatcht“ gilt in der IT-Sicherheit als ausreichender Schutz. Mythos zeigt, dass diese Grundannahme nicht mehr uneingeschränkt gilt.
Quelle: Anthropic Red Team Blog, „Mythos Preview“ (red.anthropic.com, April 2026)
Project Glasswing: Die defensive Antwort – aber für wen eigentlich?
Parallel zur Modellankündigung hat Anthropic Project Glasswing ins Leben gerufen. Die offiziellen Launch-Partner sind: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, die Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks.
Zusätzlich haben über 40 weitere Organisationen eingeschränkten Zugang erhalten. Anthropic stellt 100 Millionen US-Dollar in Nutzungsguthaben bereit sowie 4 Millionen US-Dollar in Direktspenden an Open-Source-Sicherheitsorganisationen.
Die Idee: Schwachstellen finden und schließen, bevor Angreifer sie ausnutzen – „offense informs defense“. Die Dimension ist beunruhigend: Mythos Preview hat bereits Tausende Zero-Day-Schwachstellen in allen großen Betriebssystemen und Browsern identifiziert. Zero-Day bedeutet: Lücken, die noch nie von jemandem entdeckt wurden.
Jim Zemlin, CEO der Linux Foundation, formuliert es indirekt: Open-Source-Software kann nun von den Maintainern dieser Projekte mit Mythos gescannt werden – aber nur jene, die Zugang erhalten haben. Der Rest wartet. Zudem ist die Nutzung mindestens fünfmal teurer als Opus – selbst das bereits das teuerste öffentlich verfügbare Modell am Markt ist.
Quellen: anthropic.com/glasswing (offiziell), CyberScoop (April 2026)
Preisgestaltung und Verfügbarkeit
Für Teilnehmer von Project Glasswing gelten laut llm-stats.com 25 USD pro Million Input-Token und 125 USD pro Million Output-Token – das Fünffache von Opus 4.6 (5 USD / 25 USD). Für eine allgemeine Verfügbarkeit gibt es weder ein offizielles Datum noch bestätigte Preise.
Das Modell ist über die Anthropic API, Amazon Bedrock, Google Vertex AI und Microsoft Foundry zugänglich – jeweils nur im Rahmen der Glasswing-Einladung.
Quellen: llm-stats.com (April 2026), Anthropic Developer Platform Release Notes
Was das für verschiedene Gruppen bedeutet
Für Entwickler und technische Teams: Mythos ist heute nicht nutzbar ohne explizite Einladung. Wer mit Opus 4.6 arbeitet, hat das beste öffentlich verfügbare Modell. Die Architektur sollte von Beginn an auf Sicherheit ausgelegt sein: Reverse-Proxy-Architekturen, externe Backups, minimale Angriffsflächen. Das sind keine Reaktionen auf Mythos – aber die wirksamsten verfügbaren Maßnahmen.
Die relevante Bedrohung durch KI-gestützte Angriffe kommt kurzfristig nicht von Mythos, sondern von günstigeren, weniger regulierten Modellen, die ähnliche Fähigkeiten in den kommenden Monaten entwickeln werden – oft trainiert auf den stärksten verfügbaren Modellen (vergleichbar mit dem Deepseek-Moment von 2025).
Für die Gesellschaft – die eigentlich wichtige Frage: KI-gestützte Verteidigung wird teurer und exklusiver. KI-gestützte Angriffe werden billiger und zugänglicher. Dieser Trend ist unabhängig von Mythos bereits im Gange.
Kommunale Verwaltungen, NGOs, Bildungseinrichtungen, KMUs, Schulen – sie alle verfügen nicht über die Ressourcen, mit professionellen Security Operations Centers mitzuhalten. Politische Antworten wie der europäische Cyber Solidarity Act adressieren dieses Problem ansatzweise, sind aber in der praktischen Umsetzung noch weitgehend abstrakt. Regulierung ist schnell gemacht. Konkrete Unterstützung in der Cybersicherheit kostet.
Was bleibt offen
→ Wann kommt der öffentliche Release? Kein Datum kommuniziert. → Wie verhält sich Mythos in realen Unternehmensumgebungen? Benchmarks sind kein Beweis für operative Leistung. → Wie reagiert die Konkurrenz? Google, Meta und andere Labore arbeiten parallel. → Ist Project Glasswing ausreichend? Eine kontrollierte Veröffentlichung ist kein hinreichender Schutz gegen Missbrauch.
Fazit und persönliche Einschätzung
Claude Mythos Preview ist nach meiner aktuellen Einschätzung kein klassisches Marketingereignis – auch wenn solche Ankündigungen natürlich auch Kassen klingeln lassen. Die dokumentierten und geprüften Fähigkeiten stellen einen Qualitätssprung dar, der ernst genommen werden sollte. Ohne Hysterie – aber mit konkreten Konsequenzen für Sicherheitsstrategie und politische Rahmenbedingungen.
Für die meisten Unternehmen und Betreiber ist die unmittelbare Handlungsempfehlung unverändert: Sicherheitsgrundlagen konsequent umsetzen, regelmäßige Security Audits durchführen, Angriffsflächen minimieren, Backups extern sichern. Nicht weil Mythos morgen gegen die eigene Infrastruktur eingesetzt wird – sondern weil sich Angriffswerkzeuge mit jedem neuen Modell weiterentwickeln, das veröffentlicht wird.
Ich entwickle derzeit für mich persönlich einen kleinen Sicherheitsberater, der im Interviewformat alle Schwachstellen abfragt und Empfehlungen gibt – natürlich lokal, ohne Daten in die Cloud zu schicken.