Skip to main content Skip to main navigation

Zweites Key Update für den AI Safety Report: Technische und organisatorische Ansätze des Risikomanagements

| Autonome Systeme | Data Management & Analysis | IT Security | Lernende Systeme | Mensch Maschine Interaktion | Sprache & Textverstehen | Saarbrücken

Das Themenfeld der KI entwickelt sich dynamisch. Um die Sicherheit von KI in diesem stetigen Wandel zu berücksichtigen, hat das Gremium hinter dem „International Scientific Report on the Safety of Advanced AI“ Key Updates eingeführt, in denen zwischen den umfassenden Jahresberichten auf neuste KI-Entwicklungen zeitnah eingegangen werden kann. Der zweite Zwischenbericht befasst sich mit den technischen Vorkehrungen und Schutzmaßnahmen für General-Purpose AI, die von Forschenden und Unternehmen entwickelt wurden. Außerdem werden weiterhin existierende Schwachstellen skizziert. Prof. Antonio Krüger (CEO, Deutsches Forschungszentrum für Künstliche Intelligenz) hat als der von der Bundesregierung ernannte deutsche Vertreter im Expert Advisory Panel des AI Safety Reports an diesem mitgewirkt.

© DFKI/Kaspar Van Treeck

2023 hat die britische Regierung den „International Scientific Report on the Safety of Advanced AI“ initiiert, im Januar 2025 wurde der finale Bericht als Auftakt zum AI Action Summit in Paris veröffentlicht. Da sich das Feld der KI im stetigen Wandel befindet, hat das internationale Team von Forschenden unter der Leitung von Yoshua Bengio nun den zweiten Zwischenbericht veröffentlicht.

Seit dem ersten AI Safety Report 2025 hat sich die Debatte um KI-Sicherheit verändert. Mehr Unternehmen haben eigene Sicherheitsmaßnahmen, sogenannte „Frontier AI Safety Frameworks“, aufgesetzt. Regierungen und internationale Organisationen haben Rahmenwerke für die Regulierung von General-Purpose AI geschaffen. Forschende und Entwickler konnten die Techniken zum Training sicherer Modelle sowie zur Erkennung von KI-generierten Inhalten verfeinern. Allerdings können Angreifer Abwehrmaßnahmen noch immer umgehen und die Wirkung vieler Sicherheitsvorkehrungen ist bisher noch nicht genau erforscht.

Mehr Details finden sich im zweiten Key Update des AI Safety Reports 2025.