03 April 2026, 16:02

Google DeepMind entwickelt CaMeL: Neues Framework gegen KI-Angriffe durch Prompt-Injection

Farbenfrohes Design mit dem Text "AI, Apps, IoT" auf einem weißen Hintergrund.

Google DeepMind entwickelt CaMeL: Neues Framework gegen KI-Angriffe durch Prompt-Injection

Google DeepMind stellt neues Sicherheitsframework namens CaMeL vor, um Prompt-Injection-Angriffe auf KI-Systeme zu bekämpfen

Seit Chatbots 2022 weit verbreitet sind, stellen solche Angriffe ein großes Risiko dar. Das Framework zielt darauf ab, digitale Assistenten sicherer zu gestalten, indem Sprachmodelle als potenziell unzuverlässige Komponenten behandelt werden.

Cashback bei deinen
Lieblingsrestaurants und Services

Kaufe Gutscheine und spare in deinen Lieblingsorten in deiner Nähe

CaMeL funktioniert, indem es Aufgaben zwischen zwei Sprachmodellen aufteilt: einem privilegierten KI-Modell und einem isolierten KI-Modell. Das privilegierte Modell generiert auf Basis von Nutzeranweisungen Code, während das isolierte Modell Daten in strukturierte Ausgaben verarbeitet. Diese Trennung verringert die Angriffsfläche für schädliche Eingaben.

Statt sich auf rohe KI-Antworten zu verlassen, zerlegt CaMeL Nutzeranfragen in kontrollierte Schritte. Diese werden in einem sicheren Interpreter ausgeführt, der den Datenfluss überwacht und Sicherheitsregeln durchsetzt. Nutzer müssen diese Richtlinien selbst definieren und pflegen, um das System zu schützen.

Tests mit dem AgentDojo-Benchmark zeigten, dass CaMeL Prompt-Injection-Angriffe wirksam abwehrt. Das Framework schützt zudem vor Insider-Bedrohungen und bösartigen Tools, die auf Datendiebstahl abzielen. Details zu den genauen Angriffsszenarien in den Tests wurden jedoch nicht veröffentlicht.

CaMeL bietet einen strukturierten Ansatz, um KI-Assistenten sicherer zu machen. Durch die Isolation von Aufgaben und strenge Datenkontrollen reduziert es Risiken durch Prompt-Injection und andere Exploits. Der Ansatz erfordert jedoch, dass Nutzer Sicherheitsrichtlinien aktiv verwalten, um einen dauerhaften Schutz zu gewährleisten.

Quelle

Bunt bedruckter Plakat für die Wikisound Audio Spricht Kampagne mit einem blauen Hintergrund, der fette gelbe und weiße Schrift enthält, die "Gewinner" lautet und mehrere lächelnde Fotos von Menschen in der Mitte zeigt.

Webby Awards 2025: Los Angeles Times mit zwei Nominierungen für Waldbrand-Projekte

Wie hilft man Opfern der verheerenden Waldbrände? Die Los Angeles Times überzeugt die Webby-Jury mit emotionalen Geschichten – doch die Mediengruppe selbst bleibt unerwähnt. Die Abstimmung für den Publikumspreis läuft noch bis 16. April.

Schwarze und weiße Titelseite einer deutschen Zeitung vom 13. November 1939 mit der Schlagzeile "Weitpreubliche Zeitung" und einem Foto von Menschen in traditioneller deutscher Tracht.

Pranger-Journalismus: Wenn Medien über Grenzen der Ethik hinausgehen

Von den "Sylt-Sängern" bis zu "Clownswelt": Wenn Medien Namen veröffentlichen, beginnt oft ein öffentlicher Shitstorm. Doch wer trägt die Verantwortung? Gerichte ziehen nun Grenzen – doch die Praxis bleibt umstritten.

Essen Sie in Ihren
Lieblingsrestaurants
günstiger

Exklusive Gutscheine für Abendessen, Frühstück und Kaffee

Frau mit LiberSave App auf dem Smartphone

Google DeepMind entwickelt CaMeL: Neues Framework gegen KI-Angriffe durch Prompt-Injection