15.000 Hacker greifen GPT-5 und Claude an: Dein KI-Agent ist ihr Ziel

Eine gloved Hand tippt auf einer Tastatur in einem dunklen Raum, beleuchtet von mehreren Bildschirmen, die Code und Datenfragmente anzeigen. Es vermittelt Spannung und die verborgene Natur von Cyberan

Stell dir vor, 15.000 Angreifer suchen gezielt nach den Schwachstellen in der KI, die du täglich nutzt oder bald nutzen wirst. Das ist keine Sci-Fi-Vision, sondern Realität – und es betrifft jeden, der auf KI vertraut.

clickted Redaktion05. Juni 20263 Min LesezeitCommunity-Signal

Kurzfassung

Was passiert?

Ein Startup hat 40 Millionen Dollar für eine "Armee" von 15.000 ethischen Hackern erhalten, die KI-Modelle wie GPT-5 und Claude gezielt auf Schwachstellen testen. · Diese Hacker suchen nach 'Prompt Injection'-Angriffen, Datenlecks und Manipulationsmöglichkeiten, um zu verhindern, dass KI-Agenten sensible Informationen preisgeben oder unerwünschte Aktionen ausführen. · Für Unternehmen bedeutet dies eine wachsende Notwendigkeit, ihre selbstgebauten KI-Systeme und Agenten extern auf Sicherheit prüfen zu lassen, um finanzielle Schäden und Reputationsverluste zu vermeiden.

Warum ist das wichtig?

Relevant wird das, weil diese Hacker nicht nur nach Bugs suchen. Sie trainieren KI-Modelle, sich gegen "Prompt Injection"-Angriffe zu verteidigen. Stell dir einen KI-Agenten wie einen sehr fähigen Praktikanten vor: Er macht nicht nur Vorschläge, sondern führt Befehle aus – er bucht Reisen, verschickt E-Mails, greift auf sensible Datenbanken zu. Wenn dieser Praktikant durch einen geschickten "Prompt" dazu gebracht werden kann, Dinge zu tun, die er nicht soll, stehen deine Daten, dein Geld oder sogar deine Firma auf dem Spiel. Das ist der Hebel, der hier verschoben wird: von reiner Code-Sicherhe

Ein australisches Startup hat 40 Millionen Dollar eingesammelt, um mit einer "Armee" von 15.000 ethischen Hackern die größten KI-Modelle wie GPT-5, Claude und Gemini auf Herz und Nieren zu prüfen. Ihr Ziel ist es, Schwachstellen zu finden, bevor böswillige Akteure sie ausnutzen können. Das ist kein theoretisches Problem mehr; es ist eine direkte Bedrohung für jeden, der KI-Agenten und -Systeme in seinen Alltag integriert.

Relevant wird das, weil diese Hacker nicht nur nach Bugs suchen. Sie trainieren KI-Modelle, sich gegen "Prompt Injection"-Angriffe zu verteidigen. Stell dir einen KI-Agenten wie einen sehr fähigen Praktikanten vor: Er macht nicht nur Vorschläge, sondern führt Befehle aus – er bucht Reisen, verschickt E-Mails, greift auf sensible Datenbanken zu. Wenn dieser Praktikant durch einen geschickten "Prompt" dazu gebracht werden kann, Dinge zu tun, die er nicht soll, stehen deine Daten, dein Geld oder sogar deine Firma auf dem Spiel. Das ist der Hebel, der hier verschoben wird: von reiner Code-Sicherheit zu einer echten Risiko-Kontrolle für KI-gesteuerte Aktionen.

Das Startup Horizon3.ai hat in seiner Series B Finanzierungsrunde 40 Millionen Dollar erhalten. Ihr Geschäftsmodell: Sie beschäftigen eine Community von 15.000 White-Hat-Hackern, die darauf spezialisiert sind, Schwachstellen in KI-Modellen und den darauf basierenden Agenten zu finden. Diese Hacker agieren wie Angreifer, um die Abwehr der KI zu stärken. Sie testen aktiv die Modelle von Giganten wie OpenAI und Anthropic, suchen nach Lecks und Manipulationsmöglichkeiten. Das Geld soll nun in den Ausbau der Sicherheits-Tools für Unternehmen fließen, die eigene KI-Agenten entwickeln.

Für dich als Angestellte, Freelancer oder Creator bedeutet das: Wenn du bald KI-Agenten nutzt, die selbstständig handeln, musst du deren Grenzen und Risiken verstehen. Ein KI-Agent, der deine E-Mails schreibt oder Rechnungen verschickt, könnte durch einen präparierten "Prompt" dazu gebracht werden, sensible Informationen preiszugeben oder unerwünschte Aktionen auszuführen. Dein Job könnte sich dadurch ändern, dass du nicht nur Prompts gibst, sondern auch die **Sicherheitsprotokolle** und **Freigabeschritte** für KI-Agenten überwachst. Die Fähigkeit, kritische Anweisungen zu erkennen und zu stoppen, wird zu einer neuen Kernkompetenz.

Unternehmen stehen vor einem massiven Dilemma. Einerseits versprechen KI-Agenten enorme Effizienzgewinne, weil sie ganze Prozessschritte selbstständig ausführen können. Andererseits bergen sie immense Risiken: Ein manipulierter Agent könnte Kundendaten leaken, falsche Transaktionen auslösen oder Wettbewerbsgeheimnisse offenlegen. Das Startup zielt genau auf diesen Schmerzpunkt ab: Firmen brauchen externe Auditoren, die ihre KI-Systeme **knallhart prüfen**. Es geht darum, Lock-in-Effekte zu vermeiden, bei denen Prozesse so tief in KI-Systeme verankert sind, dass ein Wechsel oder eine Kontrolle unmöglich wird.

Die größte Chance liegt in der proaktiven Verteidigung. Unternehmen, die jetzt in KI-Sicherheit investieren, können sich einen echten Wettbewerbsvorteil sichern. Indem sie ihre KI-Agenten durch solche "Hacker-Armeen" testen lassen, minimieren sie das Risiko von Datenlecks oder Manipulationen und schützen ihre Reputation. Es entsteht ein neuer Markt für spezialisierte KI-Sicherheitsdienstleistungen, der weit über traditionelle Cyber-Security hinausgeht. Hier werden neue Jobs für KI-Sicherheitsarchitekten und "Prompt-Auditor" entstehen.

Das größte Risiko ist und bleibt die "Prompt Injection". Das ist, als würde man einem Praktikanten einen harmlosen Satz sagen, der aber eine versteckte Anweisung enthält, die ihn dazu bringt, etwas Gefährliches zu tun. Das Modell kann überstimmt und manipuliert werden. Ohne strenge Tests und einen "Human-in-the-Loop" – also eine menschliche Freigabe-Instanz – könnten KI-Agenten zu unkontrollierbaren Risiken werden. Die Gefahr ist real, dass interne Unternehmensdaten oder sogar Finanztransaktionen über diese Vektoren angegriffen werden.

Prüfe jetzt, welche KI-Tools in deinem Unternehmen bereits Zahlungs-, CRM- oder Dokumentendaten verarbeiten. Baue Freigabe-Schritte ein, bevor ein Agent echte Aktionen ausführt, besonders wenn es um sensible Daten geht. Informiere dich über die Sicherheitsmaßnahmen der von dir verwendeten KI-Modelle und sei kritisch bei der Integration neuer, autonom agierender Agenten in deine Arbeitsabläufe.

Die 40 Millionen Dollar für eine Hacker-Armee sind ein klares Signal: Die KI-Sicherheit ist kein Nebenschauplatz mehr, sondern das Schlachtfeld der nächsten Jahre. Es geht um Kontrolle, Daten und Vertrauen – und darum, wer am Ende die Oberhand behält. Die Frage ist nicht, ob deine KI angegriffen wird, sondern wann und wie du darauf vorbereitet bist.

Reaktion

Frage stellen

Was das konkret heißt

Was B2B jetzt wissen muss

95/100

Unternehmen stehen vor einem massiven Dilemma. Einerseits versprechen KI-Agenten enorme Effizienzgewinne, weil sie ganze Prozessschritte selbstständig ausführen können. Andererseits bergen sie immense Risiken: Ein manipulierter Agent könnte Kundendaten leaken, falsche Transaktionen auslösen oder Wettbewerbsgeheimnisse offenlegen. Das Startup zielt genau auf diesen Schmerzpunkt ab: Firmen brauchen externe Auditoren, die ihre KI-Systeme **knallhart prüfen**. Es geht darum, Lock-in-Effekte zu vermeiden, bei denen Prozesse so tief in KI-Systeme verankert sind, dass ein Wechsel oder eine Kontrolle unmöglich wird.

Was B2C davon hat

85/100

Für dich als Angestellte, Freelancer oder Creator bedeutet das: Wenn du bald KI-Agenten nutzt, die selbstständig handeln, musst du deren Grenzen und Risiken verstehen. Ein KI-Agent, der deine E-Mails schreibt oder Rechnungen verschickt, könnte durch einen präparierten "Prompt" dazu gebracht werden, sensible Informationen preiszugeben oder unerwünschte Aktionen auszuführen. Dein Job könnte sich dadurch ändern, dass du nicht nur Prompts gibst, sondern auch die **Sicherheitsprotokolle** und **Freigabeschritte** für KI-Agenten überwachst. Die Fähigkeit, kritische Anweisungen zu erkennen und zu stoppen, wird zu einer neuen Kernkompetenz.

Der ROI-Check

Chancen

Die größte Chance liegt in der proaktiven Verteidigung. Unternehmen, die jetzt in KI-Sicherheit investieren, können sich einen echten Wettbewerbsvorteil sichern. Indem sie ihre KI-Agenten durch solche "Hacker-Armeen" testen lassen, minimieren sie das Risiko von Datenlecks oder Manipulationen und schützen ihre Reputation. Es entsteht ein neuer Markt für spezialisierte KI-Sicherheitsdienstleistungen, der weit über traditionelle Cyber-Security hinausgeht. Hier werden neue Jobs für KI-Sicherheitsarchitekten und "Prompt-Auditor" entstehen.

Risiken

Das größte Risiko ist und bleibt die "Prompt Injection". Das ist, als würde man einem Praktikanten einen harmlosen Satz sagen, der aber eine versteckte Anweisung enthält, die ihn dazu bringt, etwas Gefährliches zu tun. Das Modell kann überstimmt und manipuliert werden. Ohne strenge Tests und einen "Human-in-the-Loop" – also eine menschliche Freigabe-Instanz – könnten KI-Agenten zu unkontrollierbaren Risiken werden. Die Gefahr ist real, dass interne Unternehmensdaten oder sogar Finanztransaktionen über diese Vektoren angegriffen werden.

Was du jetzt tun solltest

Prüfe jetzt, welche KI-Tools in deinem Unternehmen bereits Zahlungs-, CRM- oder Dokumentendaten verarbeiten. Baue Freigabe-Schritte ein, bevor ein Agent echte Aktionen ausführt, besonders wenn es um sensible Daten geht. Informiere dich über die Sicherheitsmaßnahmen der von dir verwendeten KI-Modelle und sei kritisch bei der Integration neuer, autonom agierender Agenten in deine Arbeitsabläufe.

Diskussion starten

Noch keine Beiträge. Mit einem Account kannst du die Diskussion starten.

Anmelden

Quellen & Transparenz

Community-Signal

Primärquelle

Editorial Research-Agent (Tavily Search API)

https://www.forbes.com.au/news/innovation/this-ai-startups-army-of-15000-hackers-pressure-test-claude-gpt-5-and-gemini/

Quelle öffnen

Weitere Belege (1)

2 Quellen geprüft · Redaktionell verifiziert von clickted

Mehr aus dem Thema.

Themenseite · Risiken & Datenschutz

Mehr aus Risiken & Datenschutz

15.000 Hacker greifen GPT-5 und Claude an: Dein KI-Agent ist ihr Ziel

Diskussion starten

Mehr aus dem Thema.

Putin greift mit KI an – diese Modelle halten dicht, der Rest ist offen!

Krass: Trump wollte KI checken, aber sein Team ist weggefeuert! Wer schützt uns jetzt?

KI-Chatbots: Dein Kind fragt nach Selbstmord, OpenAI soll schweigen – ist das Vertrauen missbraucht?

Anthropic integriert Claude in 28 Sicherheits- und Compliance-Plattformen

KI-Angst um Jobs? Dein Chef hat ganz andere Sorgen!

USA verliert im KI-Rennen? Trump-Team streitet sich und blockiert wichtige Regeln!

15.000 Hacker greifen GPT-5 und Claude an: Dein KI-Agent ist ihr Ziel

Diskussion starten

Mehr aus dem Thema.

Putin greift mit KI an – diese Modelle halten dicht, der Rest ist offen!

Krass: Trump wollte KI checken, aber sein Team ist weggefeuert! Wer schützt uns jetzt?

KI-Chatbots: Dein Kind fragt nach Selbstmord, OpenAI soll schweigen – ist das Vertrauen missbraucht?

Anthropic integriert Claude in 28 Sicherheits- und Compliance-Plattformen

KI-Angst um Jobs? Dein Chef hat ganz andere Sorgen!

USA verliert im KI-Rennen? Trump-Team streitet sich und blockiert wichtige Regeln!

Bekomm die Ausgabe direkt. Jeden Morgen um 08:00.