AI Risk Leaderboard

Unabhängige Risikobewertung von KI-Modellen.

Dieses Leaderboard bewertet führende KI-Sprachmodelle anhand eines unabhängigen Risiko-Scores, der auf Basis eigener Sicherheitsforschung von Smart Labs AI ermittelt wird. Im Mittelpunkt stehen reale Angriffsvektoren: Prompt Injection, Datenexfiltration über Tool-Calls, Jailbreaks und unkontrolliertes Agenten-Verhalten.

Ein niedriger Score bedeutet ein geringeres Sicherheitsrisiko — das Modell zeigt in unseren Tests robusteres Verhalten gegenüber Angriffen. Die Bewertung erfolgt modell- und anbieterunabhängig und wird regelmäßig aktualisiert, wenn neue Modellversionen oder Angriffstechniken verfügbar sind.

Methodik

  •   Prompt Injection & Jailbreak-Tests
  •   Datenexfiltration via Tool-Calls
  •   Agenten-Sicherheitsverhalten
  •   Eigene Forschung (arXiv:2510.09093)

Leaderboard wird geladen…

Zugrundeliegende Forschung

Research Paper

Exploiting Web Search Tools of AI Agents for Data Exfiltration

Smart Labs AI GmbH · arXiv:2510.09093