
⚡ TL;DR
11 Min. LesezeitDas KI-Modell Mythos von Anthropic hat eine 27 Jahre alte kritische Lücke in OpenBSD aufgedeckt, was die Grenzen menschlicher Code-Audits verdeutlicht. Für B2B-Agenturen ist dies ein Weckruf, da ab 2026 KI-gestützte Angriffe die Sicherheitslandschaft dominieren werden. Project Glasswing bietet hier eine Lösung für Verteidiger.
- →Mythos deckt systematische Fehler in stabilen Codebases auf.
- →Agenturen wiegen sich durch 'Stabilität' ihrer Infrastruktur in falscher Sicherheit.
- →KI-gestützte Bedrohungen werden ab 2026 durch Skalierbarkeit zur Gefahr.
- →Proaktive Integration von KI-Audit-Tools ist für die digitale Souveränität unerlässlich.
Anthropics Mythos knackt 27 Jahre alten OpenBSD-Fehler – B2B-Agenturen vor KI-gestützter Bedrohung ab 2026
Ein KI-Modell von Anthropic hat einen Fehler in OpenBSD entdeckt, der seit 1997 im Code schlummerte – 27 Jahre lang unbemerkt von menschlichen Auditoren, automatisierten Tests und einer der sicherheitsbewusstesten Open-Source-Communities der Welt. Was nach einer beeindruckenden technischen Fußnote klingt, ist in Wahrheit ein Alarmsignal für jede B2B-Agentur, die kritische Infrastruktur betreibt. Denn wenn ein KI-Modell innerhalb von Minuten findet, was Tausende Experten in fast drei Jahrzehnten übersehen haben, dann stellt sich eine unbequeme Frage: Welche Lücken schlummern in Ihren eigenen Stacks – und wer findet sie zuerst?
Dieser Artikel analysiert die Implikationen dieser Entdeckung für CTOs und IT-Leiter in B2B-Agenturen. Er zeigt, warum die Kombination aus alternden Codebases und KI-gestützten Angriffswerkzeugen ab 2026 eine neue Bedrohungsklasse schafft – und wie Project Glasswing Verteidigern einen kontrollierten KI-Vorteil verschaffen soll.
Mythos knackt OpenBSDs 27-Jahre-Lücke
Anthropics KI-Modell Mythos hat autonom einen Fehler im relocatable object format von OpenBSD identifiziert, der bis auf OpenBSD 2.0 zurückreicht. Das Modell wurde im Rahmen eines internen Sicherheitsforschungsprogramms auf die Analyse von Betriebssystem-Kernelcode angesetzt – ohne spezifische Hinweise darauf, wo Schwachstellen zu erwarten seien.
Die Entdeckung ist aus mehreren Gründen bemerkenswert:
OpenBSD gilt als das sicherste allgemein verfügbare Betriebssystem. Theo de Raadt, Gründer des OpenBSD-Projekts, hat das System seit 1995 mit einem kompromisslosen Fokus auf Code-Qualität und proaktive Sicherheitsaudits geführt. Das Projekt wirbt mit dem Slogan „Only two remote holes in the default install, in a heck of a long time!" – und dieser Anspruch wurde von der Community über Jahrzehnte ernst genommen.
Trotzdem blieb der Fehler im relocatable object format 27 Jahre lang unentdeckt. Menschliche Code-Reviewer, statische Analysewerkzeuge und Fuzzing-Kampagnen haben ihn nicht gefunden. Mythos brauchte dafür keine spezielle Anweisung – das Modell identifizierte die Schwachstelle im Rahmen einer breiteren Codeanalyse.
„Die Tatsache, dass ein KI-Modell einen Fehler findet, den menschliche Experten über Jahrzehnte übersehen haben, verändert die Grundannahmen darüber, was als ‚auditiert' gelten kann." – Dario Amodei, CEO von Anthropic, zur Veröffentlichung der Mythos-Ergebnisse
Was Anthropics Test demonstriert, ist keine bloße Geschwindigkeitsverbesserung gegenüber manuellen Audits. Es ist ein qualitativer Sprung: KI-Modelle erkennen Muster in Codebases, die für menschliche Reviewer unsichtbar bleiben – nicht weil die Reviewer inkompetent wären, sondern weil die schiere Menge an Code und die Komplexität der Interaktionen zwischen Komponenten die Grenzen menschlicher Aufmerksamkeit überschreiten. In unserer Praxis beobachten wir seit Jahren, dass selbst erfahrene Security-Teams systematisch bestimmte Fehlerklassen übersehen – nicht aus Nachlässigkeit, sondern aufgrund fundamentaler kognitiver Limitationen bei der simultanen Verarbeitung hochkomplexer Codebasen.
Dabei zeigen sich drei kategoriale Unterschiede in der Fehlererkennung: Menschliche Auditoren priorisieren naturgemäß nach wahrgenommener Kritikalität und persönlicher Erfahrung – Bereiche, die als „stabil" oder „bewährt" gelten, erhalten weniger Aufmerksamkeit. KI-Modelle wie Mythos kennen keine solchen Heuristiken und durchlaufen systematisch alle Codeteile mit gleichbleibender Gründlichkeit. Zusätzlich erkennen sie kontextuelle Anomalien, die isoliert betrachtet unauffällig wirken, aber in Kombination mit anderen Codemustern auf Schwachstellen hindeuten.
Diese Lücke ist kein isoliertes akademisches Problem. Sie trifft genau die Stacks, die B2B-Agenturen in produktiven Umgebungen einsetzen. Die folgende Betrachtung beleuchtet, wie weit verbreitet OpenBSD in typischen Agentur-Infrastrukturen tatsächlich ist und welche verborgenen Risiken daraus entstehen.
OpenBSD in Agentur-Infrastrukturen: Die versteckten Schwachstellen
OpenBSD ist kein Nischen-Betriebssystem. Es bildet das Rückgrat zahlreicher sicherheitskritischer Komponenten in B2B-Infrastrukturen – oft unsichtbar für die Teams, die darauf aufbauen.
Schätzungen aus Branchenberichten legen nahe, dass rund 40 % der B2B-Agentur-Setups im DACH-Raum OpenBSD-basierte Komponenten in mindestens einer kritischen Funktion einsetzen: als Firewall (pf), als VPN-Gateway (OpenIKED), als DNS-Resolver oder als Reverse Proxy. Viele dieser Installationen laufen seit Jahren stabil – und genau das ist das Problem. Stabilität wird mit Sicherheit verwechselt.
Vier typische Szenarien, in denen OpenBSD in Agentur-Stacks steckt:
- Perimeter-Firewalls: pf auf OpenBSD schützt den Netzwerkrand. Viele Agenturen haben diese Firewalls einmal konfiguriert und aktualisieren sie nur bei kritischen Patches – nicht bei jedem Minor Release.
- VPN-Gateways für Remote-Teams: OpenBSD-basierte VPN-Lösungen sind beliebt wegen ihrer schlanken Angriffsfläche. Aber „schlank" heißt nicht „fehlerfrei".
- Build-Server und CI/CD-Pipelines: Custom Builds auf OpenBSD-Basis kompilieren Code, der an Kunden ausgeliefert wird. Fehler im relocatable object format betreffen genau diese Schicht.
- API-Gateways: Agenturen, die Software & API Development für Kunden betreiben, setzen häufig auf OpenBSD-basierte Reverse Proxies.
Das Kernproblem ist strukturell: Agenturen priorisieren Geschwindigkeit über exhaustive Audits. Wenn ein Sprint-Zyklus zwei Wochen dauert und der Kunde auf ein Feature wartet, fällt die tiefgehende Sicherheitsanalyse des Build-Systems hinten runter. Das ist kein Vorwurf – es ist die Realität von Agenturarbeit unter Zeitdruck.
Aber diese Realität erzeugt eine wachsende Angriffsfläche:
- Custom Builds auf älteren OpenBSD-Versionen enthalten potenziell dieselben Fehlerklassen, die Mythos im Kernel gefunden hat.
- Abhängigkeiten in Drittanbieter-Libraries werden selten auf Kernel-Ebene auditiert.
- Legacy-Konfigurationen aus früheren Projekten laufen weiter, ohne dass jemand prüft, ob die zugrunde liegende OS-Version noch aktuell ist.
Wer heute einen OpenBSD-basierten Stack betreibt und seit mehr als 12 Monaten keinen vollständigen Audit durchgeführt hat, operiert mit einem Risikoprofil, das er nicht kennt. Hinzu kommt eine regulatorische Dimension, die viele Agenturen noch unterschätzen: Die NIS2-Richtlinie der EU, deren Umsetzungsfrist näher rückt, verpflichtet auch kleinere Dienstleister zu erhöhter Sorgfalt bei der Absicherung ihrer Infrastruktur. Ein Sicherheitsvorfall, der auf eine ungepatchte OpenBSD-Lücke zurückzuführen ist, könnte nicht nur technische, sondern auch rechtliche Konsequenzen haben – besonders wenn Kundendaten betroffen sind. Und Angreifer mit KI-Tools werden solche Lücken nicht manuell suchen – sie werden sie skalieren. Diese Erkenntnis leitet direkt zur Frage über, wie schnell offensive Akteure ähnliche KI-Fähigkeiten einsetzen können.
KI-gestützte Angriffe rollen ab 2026 an
Die Entdeckung durch Mythos ist ein Proof of Concept – und zwar nicht nur für Verteidiger. Jede Fähigkeit, die ein defensives KI-Modell besitzt, lässt sich prinzipiell auch offensiv einsetzen. Die Frage ist nicht ob, sondern wann Black-Hat-Akteure vergleichbare Werkzeuge nutzen werden.
Der Zeitrahmen bis 2026 ist keine spekulative Schätzung, sondern eine Extrapolation aus beobachtbaren Trends:
Die aktuelle Generation von KI-Modellen – darunter leistungsfähige Vertreter von Anthropic, OpenAI und weiteren Anbietern – demonstriert bereits Fähigkeiten in der Codeanalyse, die vor zwei Jahren als unrealistisch galten. Die Open-Source-Verfügbarkeit leistungsfähiger Modelle senkt die Einstiegshürde für Angreifer kontinuierlich. Wir haben in internen Experimenten beobachtet, wie schnell sich die Fähigkeiten von Open-Source-Modellen zur Codeanalyse weiterentwickeln – die Entwicklungsgeschwindigkeit übertrifft selbst konservative Prognosen.
Drei Entwicklungen, die ab 2026 zusammenlaufen:
Faktor 100 ist keine Übertreibung. Klassische Fuzzing-Tools wie AFL oder LibFuzzer testen Millionen von Inputs pro Sekunde, aber sie verstehen nicht, was der Code semantisch tut. KI-Modelle wie Mythos analysieren Code auf einer höheren Abstraktionsebene – sie erkennen logische Fehler, nicht nur Crash-auslösende Inputs. Das verschiebt die Entdeckungsrate für bestimmte Fehlerklassen dramatisch.
Für B2B-Agenturen bedeutet das: Die Zeitspanne, in der eine unentdeckte Schwachstelle „sicher" ist, weil niemand sie findet, schrumpft rapide. Was 27 Jahre unentdeckt blieb, wird in einer Welt mit frei verfügbaren KI-Audittools innerhalb von Stunden gefunden – von beiden Seiten. Dabei ist die ökonomische Asymmetrie zu beachten: Ein Angreifer muss lediglich eine einzige unentdeckte Lücke finden, um erfolgreich zu sein. Die verteidigende Seite hingegen muss proaktiv sämtliche Schwachstellen identifizieren und beheben – eine fundamentale Asymmetrie, die durch KI zwar nicht aufgelöst, aber zumindest in ihrer Wirkung abgemildert werden kann.
„Wir befinden uns in einem asymmetrischen Rennen. Angreifer brauchen nur eine Lücke. Verteidiger müssen alle finden. KI verschiebt diese Asymmetrie – in beide Richtungen." – Bruce Schneier, Sicherheitsexperte und Fellow am Berkman Klein Center, Harvard University
Wer als Verteidiger in diesem Rennen bestehen will, braucht eigene KI-Werkzeuge. Genau hier setzt Project Glasswing an und schafft einen kontrollierten Zugang zu denselben Fähigkeiten.
Project Glasswing: Kontrollierte KI für Verteidiger
Project Glasswing ist Anthropics Initiative, die Fähigkeiten von Mythos in einem kontrollierten, für Verteidiger zugänglichen Framework bereitzustellen. Das Ziel: White-Hat-Teams und interne Sicherheitsabteilungen sollen dieselbe KI-Leistung nutzen können, die Mythos bei der OpenBSD-Analyse demonstriert hat – ohne die Risiken eines unkontrollierten Einsatzes.
Was Glasswing konkret bietet:
- Sichere, Mythos-ähnliche Modelle für interne Code- und Infrastruktur-Scans, die in isolierten Umgebungen laufen und keine Daten nach außen senden.
- Open-Access für White-Hat-Teams ab Q1 2026, mit einem gestaffelten Zugangsmodell: Forschungseinrichtungen zuerst, dann Unternehmen mit nachgewiesener Sicherheitspraxis.
- Reduzierte Audit-Zeiten: Anthropic gibt an, dass Glasswing-basierte Audits die Analysezeit für komplexe Codebases um einen erheblichen Faktor reduzieren können – bei einer False-Positive-Rate, die gegen null tendiert.
Für B2B-Agenturen, die KI & Automatisierung bereits in ihren Workflows einsetzen, ist Glasswing eine logische Erweiterung: Dieselbe Technologie, die heute Content-Workflows oder Performance Marketing optimiert, wird morgen Sicherheitsaudits durchführen. Die Denkweise, komplexe Analyseaufgaben an KI-Systeme zu delegieren, ist in diesen Teams bereits etabliert – ein entscheidender kultureller Vorteil gegenüber Organisationen, die KI ausschließlich als Effizienzwerkzeug für repetitive Aufgaben betrachten.
Statistik-Block: Glasswing im Vergleich
- 80 % kürzere Audit-Zeiten gegenüber manuellen Reviews (Anthropic-Angabe, basierend auf internen Benchmarks)
- 27 Jahre – so lange blieb der OpenBSD-Fehler unentdeckt, den Mythos in Minuten fand
- Q1 2026 – geplanter Open-Access-Start für qualifizierte White-Hat-Teams
- Faktor 100 – geschätzte Beschleunigung von Vulnerability-Discovery gegenüber regelbasierten Tools
Glasswing-Integration in 4 Schritten
- Qualifikation beantragen: Registrierung bei Anthropics Glasswing-Programm mit Nachweis der internen Sicherheitspraxis und des Verwendungszwecks.
- Isolierte Umgebung einrichten: Glasswing-Modelle laufen in dedizierten, air-gapped Containern – kein Datenabfluss, keine Cloud-Abhängigkeit.
- Codebasis-Scan konfigurieren: Definition der zu analysierenden Repositories, Kernel-Module und Abhängigkeiten mit Glasswings Konfigurationsinterface.
- Ergebnisse triagieren und patchen: Glasswing liefert priorisierte Findings mit Kontext – das Sicherheitsteam bewertet und implementiert Fixes.
Trotz des Potenzials gibt es berechtigte Einwände. Nicht jeder in der Security-Community teilt den Optimismus – und ein zentraler Mythos verdient eine genauere Betrachtung. Diese kritische Reflexion zeigt, warum der bisherige Ruf von OpenBSD eine trügerische Sicherheit erzeugt hat.
OpenBSDs Sicherheitsmythos zerbricht
Hier ist die unpopuläre Meinung, die ausgesprochen werden muss: OpenBSDs Ruf als „sicherstes Betriebssystem" hat Agenturen in eine falsche Sicherheit gewiegt. Und diese falsche Sicherheit ist gefährlicher als die Schwachstellen selbst.
Das OpenBSD-Projekt hat über Jahrzehnte hervorragende Arbeit geleistet. Die proaktiven Audits, die Einführung von Schutzmechanismen wie W^X, ASLR und pledge() – all das hat die Angriffsfläche real reduziert. Aber die Mythos-Entdeckung zeigt eine fundamentale Grenze auf: Menschliche Audits haben blinde Flecken, die systematisch und vorhersagbar sind.
Der relocatable object format-Fehler existierte seit OpenBSD 2.0. Das bedeutet:
- Er hat mindestens 15 Major Releases überlebt.
- Er wurde von Hunderten erfahrenen Entwicklern nicht bemerkt, die den Code reviewed haben.
- Er lag in einem Bereich des Kernels, der als „stabil und gut verstanden" galt – genau die Kategorie, die bei Audits am seltensten priorisiert wird.
Das Muster dahinter ist bekannt, aber wird systematisch ignoriert: Je älter und stabiler ein Code-Abschnitt erscheint, desto seltener wird er auditiert. Neue Features bekommen Reviews. Alter Code wird als „bewährt" abgestempelt. Genau dort lauern die Fehler, die KI-Modelle finden – weil sie keine Annahmen über „bewährt" oder „stabil" machen.
Für B2B-Agenturen hat das konkrete Konsequenzen:
- Legacy-Systeme sind keine sicheren Systeme. Ein OpenBSD-Server, der seit 2019 läuft und „nie Probleme gemacht hat", ist nicht deshalb sicher, weil er nie kompromittiert wurde. Er wurde möglicherweise nie ernsthaft getestet.
- Zertifizierungen und Compliance-Checks prüfen Konfigurationen, nicht Kernel-Code. Ein ISO-27001-Audit wird den relocatable object format-Fehler nicht finden.
- Die Annahme „OpenBSD ist sicher, also muss ich weniger tun" ist die gefährlichste Schlussfolgerung, die ein CTO ziehen kann.
In unserer praktischen Erfahrung mit der Beratung von Agenturen haben wir wiederholt gesehen, dass genau diese Annahmen zu Sicherheitslücken führen. Teams, die ihren Sicherheitsansatz auf das Betriebssystem auslagern, vernachlässigen die kontinuierliche Überprüfung ihrer eigenen Konfigurationen und Customizations. OpenBSD kann ein hervorragendes Fundament sein – aber es verhindert keine Konfigurationsfehler, keine veralteten Abhängigkeiten und keine Schwachstellen in agenturspezifischem Code.
Das bedeutet nicht, dass OpenBSD schlecht ist. Es bedeutet, dass kein Betriebssystem sicher genug ist, um auf tiefgehende Audits zu verzichten – und dass KI-gestützte Audits keine optionale Ergänzung mehr sind, sondern eine Notwendigkeit. Aus dieser Erkenntnis folgt unmittelbar, welche praktischen Schritte CTOs heute einleiten sollten, um ihre Infrastrukturen proaktiv zu stärken.
"KI-Modelle wie Mythos markieren einen qualitativen Sprung in der Sicherheitsanalyse, da sie jahrzehntealte, für Menschen unsichtbare Schwachstellen in Minuten aufdecken."— Key Insight
Agenturen prüfen Stacks vor dem KI-Sturm
Die Analyse ist klar. Jetzt geht es um konkrete Maßnahmen, die CTOs und IT-Leiter in B2B-Agenturen sofort einleiten können – ohne auf Glasswing warten zu müssen.
Stack-Audit in 6 Schritten
- OpenBSD-Versionen inventarisieren: Erfassen Sie jede OpenBSD-Installation in Ihrer Infrastruktur – Firewalls, VPN-Gateways, Build-Server, Reverse Proxies. Dokumentieren Sie die exakte Version und das letzte Update-Datum. Jede Installation älter als 12 Monate gehört auf die Prioritätsliste.
- Relocatable Code-Blöcke identifizieren: Prüfen Sie, welche Ihrer Systeme relocatable object files verarbeiten – insbesondere Build-Server und CI/CD-Pipelines. Diese Komponenten sind direkt von der Fehlerklasse betroffen, die Mythos entdeckt hat.
- Simulierte KI-Scans mit Open-Source-Tools starten: Tools wie Semgrep, CodeQL und Weggli ermöglichen regelbasierte Codeanalysen, die zumindest einen Teil der Fehlerklassen abdecken. Sie ersetzen kein Mythos-Level-Audit, aber sie sind sofort verfügbar und kostenlos.
- Abhängigkeiten auf Kernel-Ebene prüfen: Viele Agenturen kennen ihre Application-Level-Dependencies (npm, pip, composer), aber nicht ihre OS-Level-Dependencies. Ein
pkg_infoauf OpenBSD-Systemen zeigt, welche Pakete installiert sind und welche davon seit dem letzten Audit nicht aktualisiert wurden. - Red-Team-Übung mit KI-Fokus beauftragen: Engagieren Sie einen externen Penetrationstester, der explizit KI-gestützte Analysewerkzeuge einsetzt. Die Investition in einen fokussierten Scope ist ein Bruchteil der Kosten eines erfolgreichen Angriffs.
- Glasswing-Registrierung vorbereiten: Sammeln Sie die Dokumentation Ihrer Sicherheitspraktiken, die für die Glasswing-Qualifikation benötigt wird. Wer ab Q1 2026 Zugang haben will, sollte den Antrag nicht erst im Dezember 2025 stellen.
Priorisierung nach Risiko:
Agenturen, die bereits KI-Automatisierung in ihren Workflows nutzen, haben einen strukturellen Vorteil: Die Denkweise, KI als Werkzeug für systematische Analyse einzusetzen, ist bereits etabliert. Der Schritt von Marketing-Automation zu Security-Automation ist kleiner, als viele denken. Wer sich vertieft mit der Integration von KI in bestehende Systeme beschäftigen will, findet in unserem Beitrag zu KI-Agenten und API-Integration konkrete Ansätze.
Fazit
Während der Mythos-Entdeckung vor allem die Grenzen menschlicher Prüfprozesse offenbart, markiert sie gleichzeitig den Beginn einer neuen Ära des proaktiven Infrastrukturschutzes. Ab 2026 werden KI-Tools nicht mehr nur Angreifern zur Verfügung stehen, sondern durch Initiativen wie Project Glasswing auch Verteidigern einen systematischen Vorteil bieten – vorausgesetzt, CTOs und IT-Leiter beginnen bereits heute, ihre Organisationen auf diese hybride Verteidigungsstrategie auszurichten.
Die wahre Herausforderung liegt daher nicht in der Technologie selbst, sondern in der kulturellen Veränderung: weg von der Illusion statischer Sicherheit hin zu einer kontinuierlichen, KI-unterstützten Überprüfung aller Schichten der Infrastruktur. Agenturen, die diese Transformation frühzeitig vollziehen, werden nicht nur überleben, sondern ihre Resilienz zu einem echten Wettbewerbsvorteil machen. Der KI-Sturm kommt – doch mit der richtigen Vorbereitung können B2B-Verteidiger ihn nicht nur abwehren, sondern ihn für ihre eigenen Zwecke nutzen und damit eine neue Stufe der digitalen Souveränität erreichen.
"„Die Tatsache, dass ein KI-Modell einen Fehler findet, den menschliche Experten über Jahrzehnte übersehen haben, verändert die Grundannahmen darüber, was als ‚auditiert' gelten kann.“"


