Wenn KI-Agenten unsere Mails verwalten: Wie sicher ist das?
Im spannenden Interview mit dem SCY Club-Team, das beim IEEE SaTML 2025 LLMail-Inject-Wettbewerb den 11. Platz unter 224 Teams erreichte, erfahren Sie aus erster Hand, wie verwundbar selbst Microsofts modernste KI-Sicherheitssysteme sind.

Das Team aus erfahrenen Security-Experten und KI-Spezialisten von Smart Labs AI und Smart Cyber Security gibt Einblick in die faszinierende Welt der KI-Sicherheit:
🔍 Wie man mit Tricks wie “Capitalization” und “Best-of-N tailbreaking” modernste KI-Schutzsysteme umgehen kann 🚨 Warum Unternehmen ihren KI-Agenten oft zu viele Berechtigungen einräumen ⚔️ Das nie endende Katz-und-Maus-Spiel zwischen Angreifern und Verteidigern im KI-Sicherheitsbereich 🔮 Was die Zukunft für autonome KI-Systeme und deren Sicherheit bringt
Dennis Rall: arbeitet bei Smart Labs AI als AI Engineer und AI Researcher. Er beschäftigt sich mit Schwachstellen von Large Language Models (LLMs) und wie man diese sicher in bestehende IT-Landschaften integrieren kann und macht gerade seinen Dr. an der Universität AUgsburg. Der LLMail-Inject-Wettbewerb war sein erster CTF-Wettbewerb. LinkedIn
Dr. Thomas Fraunholz ist ein engagierter Wissenschaftler mit Schwerpunkt in angewandter Mathematik. Nach seiner Promotion entdeckte er in der Embedded-Programmierung und DevOps seine Leidenschaft, was ihn zum anerkannten MLOps- und NLP-Experten machte. Er leitete bereits zwei öffentlich geförderte Open-Source-Forschungsprogramme im Bereich KI in Kooperation mit dem Deutschen Zentrum für Luft- und Raumfahrt. Heute steht er an der Spitze der KI-basierten Cybersecurity-Forschung als Senior Reseracher bei der Smart Labs AI. LinkedIn
Sandro Bauer ist CTF Spieler und Pentester. Beschäftigt sich seit 2018 mit dem Thema Security und hat endlose Wochenenden in CTFs versenkt und hat sein Hobby nach dem Studium zum Beruf gemacht. Website
Florian Ludwig ist Sinologe, Data Scientist und technischer Vertriebler. Beschäftigt sich seit 2019 vertieft mit AI und Digitalisierung. Seit er auf Smart-Labs AI gestoßen ist, hat Sicherheit einen komplett neuen Stellenwert bekommen. LinkedIn
Vorstellung des Teams
Smart Labs AI: Herzlich willkommen zum Interview über den spannenden LLMail-Inject-Wettbewerb im Rahmen der 3rd IEEE Conference on Secure and Trustworthy Machine Learning (SaTML) 2025! Ich freue mich, heute das Team „SCY Club“ begrüßen zu dürfen. Stellt euch doch bitte kurz vor.
Dennis Rall: Hallo! Ich bin Dennis Rall und es ist mein erster CTF (Capture the Flag) Wettbewerb gewesen. Ich arbeite bei smart Labs Ai als einer Mischung von Ai Engineer und Ai Researcher. Wir beschäftigen uns mit Schwachstellen von Large Language Models (LLMs) insbesondere wie man diese sicher in bestehende IT-Landschaften integriert.
Dr. Thomas Fraunholz: Genau, mein Name ist Thomas Fraunholz, ich bin Senior Researcher bei der Smart Labs AI und beschäftige mich wie Dennis in einem Team mit den Schwachstellen von LLMs. Der aktuelle Wettkampf war mein zweiter CTF nach dem Letztjährigen, in dem ebenfalls Sandro schon mit dabei war. Letztes Jahr hatten wir schon viel Spaß gemeinsam und es war wieder eine super Geschichte mitzumachen, aber da werden wir sicher gleich mehr drüber reden.
Sandro Bauer: Ich bin Sandro Bauer und arbeite bei Smart Cyber Security, der Zwillingsfirma von Smart Labs AI. Ich nehme seit 2019 regelmäßig an CTFs teil, allerdings eher im klassischen Security-Bereich. Da geht es typischerweise darum, Webserver zu hacken, Zugriff auf Admin-Accounts zu bekommen oder Server zu kompromittieren. Im Gegensatz zu meinen Kollegen bin ich im CTF-Bereich der Erfahrenste, aber im AI-Bereich sehr neu. Letztes Jahr haben Thomas und ich bei einem AI CTF gut harmoniert - ich habe Security-Knowledge eingebracht, während Thomas die AI-Expertise hatte. Bei diesem aktuellen LLMail-Inject-Wettbewerb war ich leider weniger beteiligt, da ich parallel einen eigenen “klassischen” CTF mitorganisiert habe.
Smart Labs AI: Könnt ihr uns kurz erklären, worum es bei LLMail-Inject eigentlich ging?
Dr. Thomas Fraunholz: Beim aktuellen Wettkampf LLMail Inject ging es darum, dass Microsoft zusammen mit der ETH Zürich wissen wollte, wie sicher eigentlich KI-Agenten sind. Dabei hat - wohl mit Hintergedanken - natürlich die Verteidigungsmechanismen ihrer Cloud zur Verfügung auf die Probe gestellt. Dabei sind auch aktuelle Modelle von OpenAI und Microsoft zur Verfügung gestellt worden. Hab ich was vergessen Dennis?
Dennis Rall: Man könnte vielleicht erwähnen, dass der letztjährige CTF sich mit allen LLMs beschäftigt hat, um diese zu knacken. Der diesjährige CTF war einen Schritt weiter und hat sich mit einem KI-Agenten System für Mails beschäftigt. In diesem Mail-Szenario hat der KI-Agent Zugriff auf Mails, kann Mails lesen und Mails schreiben. Unser Ziel als Attacker war es eine bösartige Mail zusammenzuschreiben, die wir dann in dieses System reinbringen. Wir wollen damit den KI-Agenten dazu bringen, uns Informationen zurückzugeben, die er uns dann per Mail schickt.
Sandro Bauer: Hier ging es um einen realitätsnahen KI-Agenten mit verschiedenen Verteidigungsmechanismen. Wir haben praktisch getestet, wie robust diese Sicherheitsmaßnahmen gegen Prompt-Injection sind. Für Microsoft war es wertvolle Forschung, für uns eine Chance, praxisnahe Schwachstellen zu verstehen. Kritisch sehe ich, dass viele Unternehmen LLMs mit zu weitreichenden Berechtigungen einsetzen, ohne die Risiken richtig zu durchdenken.
Smart Labs AI: Interessant! Wie lange hat man denn Zeit, bzw. wie lange dauert ein solcher Wettbewerb?
Dr. Thomas Fraunholz: Sandro meinte CTFs können sehr kurz sein – manchmal nur wenige Stunden. Dieser dauerte deutlich länger. Insgesamt sogar mehrere Wochen, genau wie beim letztjährigen. Dies bildet auch die Komplexität der Aufgabe ab. Wir hatten für die einzelnen Problemstellungen ungefähr einen Monat Zeit, in der wir die Lösungen eingeben konnten.
Smart Labs AI:: Danke, nun kommen wir zu einer für mich persönlich sehr wesentlichen Frage: Was hat euch motiviert, an diesem Wettbewerb teilzunehmen?
Dr. Thomas Fraunholz: Ich bin gespannt darauf, was Dennis berichten wird, da er zum ersten Mal dabei ist. Als ich das letzte Mal in einen CTF hineingeworfen wurde, hätte ich nie gedacht, dass die Lernkurve so steil sein würde. Der spielerische Ansatz – in einem Wettbewerb darum zu kämpfen, besser als die anderen Teams zu sein – entfacht eine enorme Motivation, die zu einer rasanten Lernkurve in kürzester Zeit führt. Das finde ich besonders spannend, um sich intensiv mit neuen Themen auseinanderzusetzen.
Dennis Rall: Es ist doch immer eine Möglichkeit, sein theoretisches Wissen, was wir uns vorher auch angeeignet haben, quasi die Praxis umzusetzen und dann eben auch zu sehen, wie schneidet man den Vergleich mit den anderen Teams ab.
Sandro Bauer: Bei mir ist es schwer zu erklären - es ist einfach intrinsische Motivation. Ich habe einfach Lust darauf. Das ist meiner Meinung nach das Wichtigste, was man als Security Researcher braucht: den eigenen Antrieb, Dinge verstehen und “kaputt machen” zu wollen. Mir geht es darum, Technologie nicht nur zu benutzen, sondern wirklich zu durchdringen. Und dieser “Endorphin-Rush” nach stundenlanger Frustration, wenn man endlich die Lösung findet, ist unbeschreiblich. Mein gesamtes Security-Wissen habe ich durch CTFs erworben - durch praktisches Ausprobieren, Scheitern, Lernen und letztendlich doch Erfolg haben.
Smart Labs AI:: Wie es denn gelaufen?
Dr. Thomas Fraunholz: Ja, das erschreckende Ergebnis ist, dass die aktuellen Sicherheitsmechanismen der Microsoft Cloud nicht das halten, was man sich eigentlich versprechen würde, und zwar: Sichere KI-Agenten. Dennis, würdest du mir da zustimmen?
Dennis Rall: Auf jeden Fall. Am Ende haben wir den elften Platz belegt, wobei wir sogar mehr Szenarios gelöst haben als der zehnte Platz. Aber durch das Scoring vom CTF wurden die Level ein bisschen unterschiedlich gewertet, je nachdem wie viele andere Teams ein Level gelöst haben und wer das Level zuerst gelöst hat. Deswegen sind wir nach diesem Scoring Elfter, nach gelösten Levels wären wir sogar Neunter. Aber es ist auf jeden Fall ein Ergebnis, mit dem ich sehr, sehr zufrieden bin und gezeigt habe, dass wir da auch mit den Top-Teams mithalten können. Platz 11 von 224 Teams kann sich sehen lassen.
Smart Labs AI: Wie sieht das denn im Arbeitsalltag aus? Gibt es Möglichkeiten, feste Fokus-Blocks zu integrieren, bei denen Ihr an solchen Wettbewerben teilnehmen könnt?
Dr. Thomas Fraunholz: Dankenswerterweise haben wir mit Benjamin auch einen Geschäftsführer, der aus seiner eigenen Historie heraus die Teilnahme an CTFs sehr stark unter den Mitarbeitern promotet und unterstützt. Wir durften in der Tat in unserer Arbeitszeit diesen Wettbewerb durchführen. Aber wie gesagt, die Lernkurve ist ja wirklich extrem hoch und deswegen gibt es auch der Smart Labs AI wiederum Wissen zurück, die wir dann für unsere Kunden einsetzen können.
Dennis Rall: Es war auch so, dass man pro Minute nur eine Lösung senden konnte. Das heißt, wir haben es auch oft so gemacht, dass wir ein paar Ideen gesammelt haben. Die haben wir dann laufen lassen. Es hat dann einige Zeit gedauert. In dieser Zeit konnten wir uns dann mit etwas anderem beschäftigen und neue Ideen sammeln. Gesamt haben wir versucht dieses Limit gut auszuschöpfen und konsequent kontinuierlich anzugreifen.
Smart Labs AI: Ich finde es toll, dass Ihr so stark unterstützt werdet und dass es so stark promotet wird. Um es noch greifbarer zu machen. Wie viel Arbeitszeit – wahrscheinlich ja flexibel ausgelegt - steht euch für solche Wettbewerbe zur Verfügung?
Dr. Thomas Fraunholz: Ich würde sagen, in der Hochphase, also wo es dann wirklich hoch her ging, konnte man wirklich „all in“ gehen, so dass wir dann mal eine ganze Woche Zeit investiert haben, wo wir uns kontinuierlich auch Gedanken darüber gemacht haben. Und dann gab es natürlich auch Zeiten, in denen man gesagt hat, wir lassen jetzt einfach mal unsere automatisierten Attacken so nebenher laufen.
Sandro Bauer: Durch unseren Chef Ben wird das tatsächlich stark gefördert. Beim letzten CTF hatten Thomas und ich sogar zwei Wochen bekommen, um uns voll darauf zu konzentrieren. Wir haben natürlich auch an den Wochenenden außerhalb der Arbeitszeit weitergemacht. Das hat sich richtig ausgezahlt - wir sind dann nach Amsterdam gefahren und haben unsere Ergebnisse vorgestellt. Falls man dazu mehr lernen möchte kann man auch ein Youtube video ansehen.
[Anm. d. Red.: Das Video ist hier hier zu sehen]
CTFs sind aber nicht nur reine Arbeitszeit - manchmal sitzt man abends oder am Wochenende noch dran, weil man einfach nicht aufhören kann, wenn man kurz vor dem Durchbruch steht. Im diesjährigen CTF hatte ich aber einen eigenen mitorganisieren müssen und konnte daher nur teilweise hier mitwirken, der Hauptanteil des Erfolgs geht also an meine Teamkollegen.
Smart Labs AI: Gut, dann möchte ich inhaltlich einige Fragen stellen – vor allem: Was waren die beeindruckendsten Aha-Momente oder Erfolgsmomente bei diesem Wettbewerb?
Dennis Rall: Zunächst einmal: Der CTF war so konzipiert, dass er stets verschiedene Szenarien bot, in denen unterschiedliche Modelle zum Einsatz kamen – einmal das Phi3-Modell, ein anderes Mal GPT4o-mini. Mit GPT4o-mini hatten wir eine Zeit lang intensiv zu kämpfen, da bereits im Training eine Verteidigungsmaßnahme namens Instruction Hierarchy implementiert war. Als wir es schließlich nach einiger Zeit intensiven Ausprobierens schafften, diese zu überwinden und die Level mit GPT4o-mini zu lösen, erlebten wir einen echten Erfolgs-Moment.
Verteidigungsmethoden – einfaches Beispiel, wie man sie umgehen kann
Smart Labs AI: Könnt Ihr ein typisches Beispiel geben, wie man ein Model überlisten kann? Am besten ein einfaches, dass auch „old School“ sein kann, damit man sich das ein wenig vorstellen kann?
Dr. Thomas Fraunholz: Ich glaube, die Capitalization, Dennis, kann man ganz gut erklären, oder?
Dennis Rall: Ja. Im Prinzip gibt es eine Strategie für Attacken, die heißt Best-of-N tailbreaking. Die funktioniert so, dass ich einen Prompt habe und da eben zufällig Kleinbuchstaben in den Großbuchstaben umwandle, Das hat dann die Auswirkung, dass die Tokens, in die die Wörter zerlegt werden, bevor sie zum LLM reingegeben werden, dass die sich leicht ändern, aber eben der Inhalt noch möglichst nah an dem ursprünglichen Input bleibt und man dadurch durchaus auch Sicherheitsmechanismen umgehen kann. Das ist auch eine Technik, die wir dann auch sehr, sehr oft und auch erfolgreich eingesetzt haben.
Blick in die Zukunft
Smart Labs AI: Danke für die Einsicht. Wer tiefer gehen möchte: YouTube Video Nun ein Blick in die Zukunft: Welche Entwicklungen seht ihr in der KI-Security auf uns zukommen? Werden die Systeme sicherer?
Dr. Thomas Fraunholz: Hoffentlich.
Dennis Rall: Es ist ein typisches Katz-und-Maus-Spiel, wie es auch so bei klassischem Hacking im Prinzip der Fall ist. Das heißt, die Attacken entwickeln sich, dann werden die Verteidigungen wieder angepasst. Das sieht man jetzt auch daran, dass der CTF in die zweite Runde geht, wo sich Microsoft auch angeschaut hat, wie sind denn die Angeleiter durch die Sicherheitsschranken durchgegangen und haben ein bisschen Fine-Tuning an ihren Verteidigungen betrieben und dann in die zweite Runde gestartet. Allerdings wurden da auch schon wieder die ersten Verteidigungen umgangen. Das heißt, man sollte weiterhin auch immer, wenn man KI-Systeme einsetzt, sich der Risiken Bewusstsein und auch immer an die Sicherheitsmechanismen denken.
Smart Labs AI: Danke, Herr Dr. Fraunholz, haben Sie auch noch eine Idee?
Dr. Thomas Fraunholz: Ich glaube, man sollte grundsätzlich das Prinzip der walten lassen, das auch in anderen Bereichen gilt: nur immer so viel Information wie unbedingt für die Aufgabe notwendig, einem KI-System zur Verfügung zu stellen. Und auch nicht zu viel Autonomie erwarten oder fordern. Ich glaube, dann ist man eigentlich recht gut aufgestellt.
Dennis Rall: Wir müssen dazu bedenken, dass sich die KI in Richtung größerer Selbstständigkeit entwickelt – sie „navigiert“ beispielsweise zunehmend autonom durch den Browser. Manus war dazu vor einigen Wochen in den Medien, und natürlich werden, je mehr die KI eigenständig agiert – etwa bei automatisierten Reiseplanungen – auch weitere Sicherheitsregeln erforderlich. Auch internationale Grenzen werden Wobei tatsächlich da ja auch gerade so ein bisschen viel sich in die Richtung entwickelt, dass so der KI auch quasi sich durch den Browser durchfliegt. Ich glaube, da war es Manus vor ein paar Wochen auch hoch in den Medien. Und natürlich, je mehr die KI selbstständig macht, wenn es dann auch in Richtung irgendwie automatisch meine Reise in andere Länder geht, da kommen natürlich noch mal viel mehr Sicherheitsregeln auf uns zu. Und natürlich sollte noch mehr Fokus auf die Sicherheit gelegt werden.
Sandro Bauer: Ich stimme Thomas absolut zu - weniger ist definitiv mehr bei KI-Systemen! Als Industrie befinden wir uns gerade in einer gefährlichen Phase, wo wir überall KI einsetzen wollen, ohne die Sicherheitsimplikationen wirklich verstanden zu haben. Das Hauptproblem ist, dass viele Entwickler LLMs wie magische Blackboxen behandeln, ohne deren Grenzen zu verstehen. Bei klassischer Software kannst du den Code analysieren und Schwachstellen finden, aber bei LLMs ist das viel schwieriger. Was mich ebenfalls wie Dennis besonders beunruhigt: Unternehmen geben KI-Systemen viel zu weitreichende Berechtigungen. Ein KI-Agent, der deine Mails lesen und beantworten kann, hat bereits enormes Schadenspotential, wenn er kompromittiert wird. Und je autonomer diese Systeme werden, desto schwieriger wird die Kontrolle. Der einzige Weg zu mehr Sicherheit führt über ein grundlegendes Umdenken: Zero-Trust-Prinzipien auch für KI, minimale Berechtigungen, und vor allem ein realistisches Verständnis der Schwachstellen dieser Technologie. Die aktuellen Sicherheitsmechanismen sind noch in den Kinderschuhen - wir müssen viel weiter denken.
Smart Labs AI: Kurz noch zu SCY Club, was steht dahinter?
Dr. Thomas Fraunholz: Die Smart Labs AI ist ja ein Spross der Smart Cyber Security GmbH und deren Abkürzung war SCY und deswegen haben wir uns SCY Club genannt. Ein neuer Name wird noch entwickelt.
Smart Labs AI: Herzlichen Dank für das Interview und weiterhin viel Erfolg!