Ein strukturiertes Rahmenwerk zur Risikobewertung von KI-Anbietern – Fragebögen, Warnsignale, vertragliche Schutzmaßnahmen und fortlaufende Überwachung gemäß EU-KI-Verordnung.
•
•
16 Minuten Lesezeit
Themen
Der Großteil von Enterprise-KI wird nicht im eigenen Haus entwickelt. Laut Gartner wurde erwartet, dass bis 2025 über 70 % der Unternehmen mindestens eine Form von KI einführen würden, die von einem Drittanbieter bereitgestellt wird [1]. Diese Zahl ist seither nur noch gewachsen. Dennoch wurden die Governance-Frameworks, auf die sich die meisten Organisationen verlassen, für Software entwickelt, die sie selbst kontrollieren, und nicht für probabilistische Systeme, die auf Daten trainiert wurden, die sie noch nie gesehen haben, die nach Plänen aktualisiert werden, die sie nicht festlegen, und die nach einer Logik arbeiten, die selbst für den Anbieter undurchsichtig sein kann.
Die Regulierungslandschaft hat diese Realität inzwischen eingeholt. Das EU-KI-Gesetz (EU AI Act), dessen schrittweise Durchsetzung im Jahr 2025 begann, zieht eine klare Grenze zwischen Anbietern (denen, die ein KI-System entwickeln oder in Verkehr bringen) und Betreibern (denen, die es unter eigener Verantwortung einsetzen). Doch diese Grenze entbindet die Betreiber nicht von ihrer Verantwortung. Artikel 26 stellt klar, dass Betreiber von Hochrisiko-KI-Systemen spezifische Pflichten in Bezug auf menschliche Aufsicht, Qualität der Eingabedaten, Überwachung und Protokollierung tragen [2]. Die unbequeme Wahrheit für Beschaffungs- und Compliance-Teams lautet: Die regulatorische Haftung geht nicht einfach deshalb auf den Anbieter über, weil dieser das Modell entwickelt hat.
Dieser Leitfaden bietet ein strukturiertes Framework zur Risikobewertung von KI-Drittanbietern – von der ersten Due-Diligence-Prüfung bis hin zur laufenden Überwachung.
Warum das KI-Risiko von Drittanbietern einen anderen Ansatz erfordert
Das traditionelle Risikomanagement von Drittanbietern bewertet Betriebszeiten, Datensicherheit und vertragliche SLAs. Diese sind auch für KI-Anbieter weiterhin notwendig, reichen jedoch nicht aus. KI-Systeme führen eine Kategorie von Risiken ein, für deren Bewältigung die konventionelle IT-Beschaffung nie konzipiert wurde.
Drei Eigenschaften führen dazu, dass sich KI von Drittanbietern grundlegend von anderer Software unterscheidet:
Undurchsichtigkeit der Entscheidungslogik. Eine herkömmliche SaaS-Anwendung führt deterministischen Code aus. Ein KI-System hingegen kann Ergebnisse liefern, die durch Trainingsdaten, Feinabstimmungen und Inferenzparameter geprägt sind, in die das betreibende Unternehmen keinerlei Einblick hat. Wenn ein Kreditprüfungsmodell einen Antrag ablehnt oder ein HR-Vorauswahltool Kandidaten einstuft, muss der Betreiber diese Entscheidung begründen können. Kann der Anbieter keine aussagekräftige Erklärung liefern, bleibt der Betreiber für Ergebnisse verantwortlich, die er selbst nicht interpretieren kann.
Dynamisches Verhalten. Traditionelle Software ändert sich durch versionierte Releases. Das Verhalten von KI-Modellen kann sich durch erneutes Training, Feinabstimmung oder Änderungen an den zugrunde liegenden Datenpipelines verschieben – manchmal ohne formellen Release-Zyklus. Ein Modell, das während der Beschaffung innerhalb akzeptabler Parameter funktionierte, kann im Laufe der folgenden Monate abweichen. Der Betreiber bemerkt dies unter Umständen erst, wenn bereits ein Schaden entstanden ist.
Vererbtes Datenrisiko. Die Trainingsdaten, die das Verhalten eines Modells prägen, können Verzerrungen (Biases), urheberrechtlich geschütztes Material oder personenbezogene Daten enthalten, die ohne angemessene Rechtsgrundlage verarbeitet wurden. Der Betreiber erbt die Folgen dieser vorgelagerten Entscheidungen, selbst wenn er an deren Entstehung nicht beteiligt war. Unter der DSGVO trägt der Betreiber, wenn ein KI-System personenbezogene Daten in einer Weise verarbeitet, die nicht mit den Datenverarbeitungsvereinbarungen des Betreibers übereinstimmt, das Haftungsrisiko gemeinsam mit dem Anbieter [3].
Herkömmliche Scorecards für Anbieter erfassen diese Dynamiken nicht. Ein zweckgebundenes Bewertungs-Framework ist daher unerlässlich.
Ein strukturiertes Framework zur Risikobewertung von KI-Anbietern
Das folgende Framework gliedert die Bewertung von KI-Anbietern in sieben Bereiche. Jeder Bereich befasst sich mit einem spezifischen Governance-Aspekt und kann während der Beschaffung, bei regelmäßigen Überprüfungen oder bei anlassbezogenen Neubewertungen bewertet werden.
Unternehmen, die Plattformen wie Enzai nutzen, können dieses Framework in bestehende Workflows für den Lebenszyklus von Anbietern integrieren. So wird sichergestellt, dass KI-spezifische Kriterien neben traditionellen IT-Risikoindikatoren stehen, anstatt in einem separaten, isolierten Prozess behandelt zu werden.
Bewertungsfragebogen
Bereich | Bewertungskriterien | Leitfaden zur Bewertung |
|---|---|---|
Modelltransparenz | Legt der Anbieter Modelltyp, Architekturfamilie und Version offen? Kann der Anbieter Model Cards oder Datenblätter bereitstellen? Gibt es eine Dokumentation bekannter Einschränkungen? | Vollständige Offenlegung mit Model Cards = Hoch. Teilweise Offenlegung = Mittel. „Proprietär, Weitergabe nicht möglich“ = Niedrig. |
Daten-Governance | Welche Daten wurden für das Training verwendet? Bestätigt der Anbieter die rechtmäßige Grundlage für die Datenverarbeitung? Sind Nachweise zur Datenherkunft verfügbar? Wie werden personenbezogene Daten bei der Inferenz behandelt? | Dokumentierte Datenherkunft mit Rechtsgrundlage = Hoch. Allgemeine Erklärungen ohne Belege = Mittel. Keine Informationen verfügbar = Niedrig. |
Prüfung auf Bias und Fairness | Hat der Anbieter Audits zur Überprüfung von Verzerrungen (Bias) durchgeführt? Für welche geschützten Merkmale? Sind die Ergebnisse einsehbar? Welche Abhilfeprozesse gibt es? | Unabhängiges Audit durch Dritte mit veröffentlichten Ergebnissen = Hoch. Interne Tests mit Dokumentation = Mittel. Keine Tests oder „darauf testen wir nicht“ = Niedrig. |
Sicherheit | Welche Sicherheitszertifizierungen besitzt der Anbieter (SOC 2, ISO 27001)? Wie werden Modelle vor gegnerischen Angriffen (adversarial attacks), Prompt-Injection oder Datenextraktion geschützt? Gibt es ein Programm zur Offenlegung von Sicherheitslücken? | Relevante Zertifizierungen plus KI-spezifische Sicherheitsmaßnahmen = Hoch. Nur allgemeine Zertifizierungen = Mittel. Keine Zertifizierungen = Niedrig. |
Compliance und Zertifizierungen | Kann der Anbieter die Einhaltung des EU-KI-Gesetzes, der DSGVO oder branchenspezifischer Vorschriften nachweisen? Liegt eine Konformitätsbewertung für Hochrisiko-Systeme vor? | Abgeschlossene Konformitätsbewertung mit Dokumentation = Hoch. Compliance-Programm in Arbeit = Mittel. Keine Compliance-Aktivitäten = Niedrig. |
Reaktion auf Vorfälle (Incident Response) | Verfügt der Anbieter über einen dokumentierten Plan zur Reaktion auf KI-Sicherheitsvorfälle? Wie sehen die Benachrichtigungsfristen aus? Gibt es einen Prozess zur Nachbereitung von Vorfällen (Post-Incident Review)? | Dokumentierter Plan mit definierten SLAs und Nachbereitung = Hoch. Allgemeiner Vorfallprozess ohne KI-Spezifik = Mittel. Kein Prozess = Niedrig. |
Update- und Änderungsmanagement | Wie kommuniziert der Anbieter Modell-Updates? Gibt es eine Frist für die Vorankündigung von Änderungen? Kann der Betreiber Updates testen, bevor sie live gehen? Ist ein Rollback möglich? | Vorankündigung mit Testfenster und Rollback-Option = Hoch. Benachrichtigung erst nach Bereitstellung = Mittel. Kein Benachrichtigungsprozess = Niedrig. |
Abhängigkeit von Unterauftragsverarbeitern und Basismodellen | Verlässt sich der Anbieter auf vorgelagerte KI-Anbieter (z. B. OpenAI, Anthropic, Google)? Was passiert, wenn der vorgelagerte Anbieter Bedingungen ändert, Modelle aktualisiert oder einen Ausfall hat? Werden vertragliche Schutzbestimmungen weitergegeben? | Vollständige Offenlegung vorgelagerter Anbieter mit vertraglicher Weitergabe und Notfallplänen = Hoch. Teilweise Offenlegung = Mittel. Keine Offenlegung oder Abhängigkeit von einem einzigen Anbieter ohne Alternative = Niedrig. |
Diese Tabelle sollte als dynamisches Instrument betrachtet werden. Die Bewertungsschwellen variieren je nach Anwendungsfall: Ein im Gesundheitswesen zur Triage eingesetztes Hochrisiko-KI-System erfordert eine weitaus strengere Transparenz als ein Tool zur Inhaltsempfehlung mit geringem Risiko.
Wichtige Fragen an Anbieter
Ein Fragebogen ist nur dann nützlich, wenn die Fragen präzise genug sind, um tatsächliche Risiken aufzudecken. Vage Fragen führen zu vagen Antworten. Die folgenden, nach Kategorien geordneten Fragen sind darauf ausgelegt, aussagekräftige Antworten zu erhalten.
Modelltransparenz und Erklärbarkeit
Welche Modellarchitektur nutzt dieses System und welche Version ist derzeit in der Produktionsumgebung im Einsatz?
Können Sie eine Model Card oder ein technisches Datenblatt bereitstellen, das die vorgesehenen Anwendungsfälle, bekannten Einschränkungen und Benchmarks zur Leistungsfähigkeit beschreibt?
Welche Methoden stehen zur Verfügung, um betroffenen Personen einzelne Vorhersagen oder Entscheidungen zu erklären?
Falls das Modell auf einem Basismodell eines Drittanbieters basiert (z. B. dem Anbieter eines LLM), können Sie offenlegen, um welches Basismodell und welche Version es sich handelt?
Daten-Governance und Datenschutz
Welche Datensätze wurden verwendet, um dieses Modell zu trainieren und zu validieren, und können Sie einen Nachweis über die Datenherkunft erbringen?
Was ist die rechtmäßige Grundlage gemäß DSGVO (oder gleichwertiger Vorschriften) für die Verarbeitung personenbezogener Daten beim Training?
Speichert, merkt sich oder reproduziert das Modell Trainingsdaten während der Inferenz? Welche Sicherheitsvorkehrungen verhindern Datenlecks?
Wie werden Kundendaten nach der Bereitstellung verwendet – fließen sie in das Modelltraining zurück und kann der Kunde dem widersprechen (Opt-out)?
Bias, Fairness und Sicherheit
Wurde dieses Modell auf Verzerrungen (Bias) in Bezug auf geschützte Merkmale im Sinne des geltenden Antidiskriminierungsrechts geprüft?
Wer hat das Audit durchgeführt und sind die Ergebnisse zur Überprüfung verfügbar?
Welche laufenden Überwachungsmaßnahmen sind eingerichtet, um neu auftretende Verzerrungen oder Leistungsabfälle bei bestimmten Untergruppen zu erkennen?
Für generative KI-Systeme: Welche Sicherheitsvorkehrungen verhindern die Generierung schädlicher, irreführender oder rechtlich problematischer Inhalte?
Sicherheit und Resilienz
Welche spezifischen Schutzmaßnahmen bestehen gegen gegnerische Angriffe, Prompt-Injection, Modell-Inversion oder die Extraktion von Trainingsdaten?
Wurde das System KI-spezifischen Penetrationstests oder Red-Teaming-Aktivitäten unterzogen, die über Standardprüfungen der Anwendungssicherheit hinausgehen?
Wie sieht der Disaster-Recovery- und Business-Continuity-Plan speziell für die KI-Komponenten dieses Dienstes aus?
Compliance und regulatorische Bereitschaft
Wurde dieses System gemäß den Risikokategorien des EU-KI-Gesetzes eingestuft, und wenn ja, welche Einstufung hat es erhalten?
Können Sie die Dokumentation einer Konformitätsbewertung für Hochrisiko-KI-Systeme gemäß Artikel 43 vorlegen?
Wie sieht Ihr Zeitplan für die vollständige Einhaltung der geltenden KI-Vorschriften in unseren Betriebsländern aus?
Reaktion auf Vorfälle und Rechenschaftspflicht
Wie sieht Ihr KI-spezifischer Plan zur Reaktion auf Sicherheitsvorfälle aus und was löst eine Einstufung als Vorfall aus?
Wie lang ist die vertragliche Benachrichtigungsfrist für KI-bezogene Vorfälle, die unsere Bereitstellung betreffen?
Können Sie Beispiele für frühere KI-Vorfälle nennen und beschreiben, wie diese gelöst wurden?
Nicht jede Frage wird auf jeden Anbieter zutreffen. Das Fehlen glaubwürdiger Antworten auf Fragen, die eindeutig relevant sind, ist jedoch an sich schon ein wichtiges Ergebnis.
Warnsignale (Red Flags) bei Antworten von Anbietern
Bei der Bewertung von Anbietern geht es ebenso sehr darum, wie Organisationen Antworten erhalten, wie um den Inhalt dieser Antworten selbst. Bestimmte Muster in den Antworten von Anbietern sollten eine genauere Prüfung nach sich ziehen.
Vagheit unter dem Deckmantel der Vertraulichkeit
Der Schutz von Geschäftsgeheimnissen ist absolut legitim. Ein Anbieter, der sich jedoch weigert, die allgemeine Architekturfamilie eines Modells, die Kategorien der verwendeten Trainingsdaten oder das Vorhandensein von Bias-Prüfungen offenzulegen, schützt nicht sein geistiges Eigentum. Er verschleiert Risiken. Ein Anbieter, der auf jede Frage zur Transparenz mit „Unser Modell ist proprietär und wir können keine Details weitergeben“ antwortet, ist nicht in der Lage, einen Betreiber bei der Erfüllung seiner gesetzlichen Pflichten zu unterstützen.
Fehlende Dokumentation
Wenn ein Anbieter keine Model Card, keine Daten-Governance-Richtlinie oder keinen Plan zur Reaktion auf Vorfälle vorlegen kann, liegt die naheliegendste Erklärung darin, dass diese Dokumente nicht existieren. Das Fehlen einer Dokumentation ist kein neutrales Ergebnis. Es zeigt, dass der Anbieter nicht in die Governance-Infrastruktur investiert hat, die für einen verantwortungsvollen Einsatz erforderlich ist.
Ablehnung von Audit-Rechten
Jeder Anbieter, der sich gegen vertragliche Audit-Rechte sträubt – sei es mit dem Argument, dies sei logistisch schwierig oder wirtschaftlich unzumutbar –, sollte mit Vorsicht genossen werden. Das EU-KI-Gesetz sieht ausdrücklich vor, dass Betreiber die Compliance von Anbietern überprüfen müssen [4]. Ein Anbieter, der sich Audit-Klauseln widersetzt, wird einer genaueren Überprüfung möglicherweise nicht standhalten.
Kein Prozess zur Reaktion auf Vorfälle
Wenn die Antwort des Anbieters auf die Frage „Wie sieht Ihr Plan zur Reaktion auf KI-Sicherheitsvorfälle aus?“ Schweigen ist, er auf ein allgemeines IT-Incident-Management verweist oder verspricht, einen solchen Plan erst noch zu entwickeln, sollte das Unternehmen abwägen, ob es bereit ist, die volle Verantwortung für ein KI-Versagen ohne Unterstützung des Anbieters zu tragen.
Verschiebung der Haftungsverpflichtungen
Achten Sie auf vertragliche Formulierungen, die versuchen, die gesamte Haftung für KI-Ergebnisse auf den Betreiber zu übertragen. Zwar tragen auch Betreiber Pflichten, doch ein Anbieter, der keinerlei Verantwortung für Modellleistung, Bias oder Systemausfälle übernimmt, signalisiert damit mangelndes Vertrauen in seine eigenen Systeme.
Das Gesamtmuster ist entscheidender als jede einzelne Antwort. Ein Anbieter, der offen mit tatsächlichen Einschränkungen umgeht, birgt ein weitaus geringeres Risiko als ein Anbieter, der Perfektion verspricht, ohne Belege dafür zu liefern.
Vertragliche Schutzregelungen für die KI-Beschaffung
Eine Bewertung ist notwendig, reicht aber allein nicht aus. Die Ergebnisse müssen in verbindlichen vertraglichen Bestimmungen verankert werden. Standardvereinbarungen für den Softwareeinkauf enthalten selten Klauseln, die dem spezifischen KI-Risiko gerecht werden. Die folgenden Klauseln sollten für die Aufnahme in jede KI-Anbietervereinbarung in Betracht gezogen werden.
Audit-Rechte
Die Vereinbarung sollte dem Betreiber das Recht einräumen, die KI-Systeme des Anbieters in angemessenen Abständen sowie bei Eintritt bestimmter Ereignisse (wie etwa eines gemeldeten Vorfalls oder einer behördlichen Anfrage) direkt oder durch einen unabhängigen Dritten zu prüfen. Dieses Recht sollte sich auf Modellleistungsdaten, Ergebnisse von Bias-Prüfungen und Daten-Governance-Praktiken erstrecken.
Benachrichtigung bei Vorfällen
In der Vereinbarung sollten maximale Benachrichtigungsfristen für KI-bezogene Vorfälle festgelegt werden, die sich von allgemeinen IT-Betriebsstörungen unterscheiden. Für Hochrisiko-Systeme ist eine Benachrichtigung innerhalb von 24 Stunden nach Entdeckung ein angemessener Ausgangspunkt. Die Meldung sollte die Art des Vorfalls, die betroffenen Systeme, die geschätzten Auswirkungen und die Schritte zur Behebung enthalten.
Datenverarbeitung und -aufbewahrung
Die Vereinbarung sollte genau festlegen, wie Kundendaten im Zusammenhang mit dem KI-System verwendet werden: Ob sie zur Modellverbesserung genutzt werden, wie sie gespeichert werden, wann sie gelöscht werden und ob der Kunde verlangen kann, dass sie aus den Trainingsdatensätzen entfernt werden. Dies ist angesichts der anhaltenden Aufmerksamkeit der Aufsichtsbehörden auf die Schnittstelle zwischen KI-Training und Datenschutzrechten besonders kritisch [5].
Benachrichtigung bei Modelländerungen
Die Vereinbarung sollte den Anbieter verpflichten, wesentliche Änderungen am Modell im Voraus anzukündigen. Dazu gehören das erneute Training mit neuen Daten, Änderungen der Architektur und wesentliche Parameteranpassungen. Die Ankündigungsfrist sollte es dem Betreiber ermöglichen, Tests durchzuführen, bevor das aktualisierte Modell in seiner Produktivumgebung live geht. Eine 30-tägige Ankündigungsfrist für nicht dringende Änderungen ist ein angemessener Standard.
Leistungs-Benchmarks und SLAs
Über klassische Verfügbarkeits-SLAs hinaus sollte die Vereinbarung messbare Leistungs-Benchmarks für das KI-System festlegen, einschließlich Genauigkeitsschwellen, Fairness-Metriken und Latenzanforderungen. Eine连续 Verletzung dieser Benchmarks sollte definierte Nachbesserungspflichten und gegebenenfalls Kündigungsrechte nach sich ziehen.
Haftungsverteilung
Die Vereinbarung sollte die Haftung für KI-bezogene Schäden so aufteilen, dass sie das Maß an Kontrolle der jeweiligen Partei widerspiegelt. Ein Anbieter, der das Modell, die Trainingsdaten und den Update-Zyklus kontrolliert, sollte eine angemessene Haftung für Mängel an diesen Komponenten tragen. Eine pauschale Freistellung zugunsten des Anbieters ist beim Einsatz von KI ungeeignet.
Starke Verträge ersetzen keine Governance, aber sie bieten den Durchsetzungsmechanismus, der Governance erst wirksam macht.
Laufende Überwachung: Mehr als eine einmalige Bewertung
Eine einmalige Bewertung des KI-Anbieters bei der Beschaffung, die anschließend in den Akten verschwindet, ist lediglich ein Compliance-Alibi, aber kein wirksames Risikomanagement. KI-Systeme verändern sich, und damit auch die Risiken, die sie bergen.
Indikatoren zur kontinuierlichen Überwachung
Unternehmen sollten eine kontinuierliche Überwachung in verschiedenen Dimensionen etablieren:
Leistungsdrift (Performance Drift). Verfolgen Sie die Qualität der Ergebnisse des KI-Systems im Vergleich zu den bei der Beschaffung festgelegten Benchmarks. Eine Verschlechterung kann auf ein Abweichen des Modells (Model Drift), Probleme mit der Datenpipeline oder unangekündigte Modelländerungen hindeuten.
Häufigkeit und Schwere von Vorfällen. Protokollieren Sie alle KI-bezogenen Vorfälle, einschließlich Beinahe-Fehler, und analysieren Sie deren zeitlichen Verlauf. Eine zunehmende Häufigkeit fehlerhafter Ergebnisse erfordert eine Untersuchung.
Regulatorische Entwicklungen. Beobachten Sie Änderungen in der geltenden KI-Gesetzgebung, die die Risikoeinstufung des Systems verändern oder den Betreibern neue Pflichten auferlegen könnten.
Finanzielle und operative Stabilität des Anbieters. Ein Anbieter in finanziellen Schwierigkeiten spart möglicherweise an der Modellpflege, der Sicherheit oder der Compliance – was sich direkt auf den Betreiber auswirkt.
Auslöser für eine Neubewertung
Bestimmte Ereignisse sollten außerhalb des regulären Prüfungszyklus eine vollständige Neubewertung des Anbieters auslösen:
Der Anbieter kündigt ein wichtiges Modell-Update oder eine Änderung der Architektur an.
Es tritt ein schwerwiegender KI-Vorfall auf, sei es in der eigenen Umgebung des Unternehmens oder im Rahmen öffentlicher Berichte.
Regulatorische Leitlinien ändern die Risikoklassifizierung des KI-Systems.
Das Unternehmen ändert den Einsatz des KI-Systems in einer Weise, die das Risikoprofil wesentlich verändert.
Der Anbieter wird übernommen, fusioniert oder es kommt zu einem wesentlichen Führungswechsel.
Einbindung der Überwachung in Governance-Workflows
Eine effektive laufende Überwachung erfordert mehr als nur gute Absichten. Sie benötigt Tools, die die Überwachung der Anbieter in bestehende Governance-Strukturen integrieren. Enzai bietet die Infrastruktur für eine kontinuierliche Überwachung von KI-Drittanbietern, indem Bewertungsergebnisse, vertragliche Pflichten und Echtzeit-Leistungsindikatoren in einem einzigen Governance-Workflow zusammengeführt werden. Ohne diese Integration lässt die Aufmerksamkeit bei der Überwachung im Laufe der Zeit meist nach, was Unternehmen genau dann ungeschützt lässt, wenn Wachsamkeit am dringendsten vonnöten ist.
Governance ist kein einmaliges Ereignis, sondern ein fortlaufender Prozess.
Die Falle des Artikels 25: Wenn Betreiber zu Anbietern werden
Eine der folgenreichsten und am wenigsten verstandenen Bestimmungen des EU-KI-Gesetzes betrifft die Umstände, unter denen ein Betreiber als Anbieter neu eingestuft wird. Artikel 25 legt fest, dass ein Betreiber als Anbieter gilt, wenn er seinen Namen oder seine Marke auf einem bereits auf dem Markt befindlichen Hochrisiko-KI-System anbringt, eine wesentliche Veränderung an einem Hochrisiko-System vornimmt, den Verwendungszweck eines KI-Systems so ändert, dass es als Hochrisiko-System eingestuft wird, oder ein Hochrisiko-System in Verkehr bringt, nachdem ein Dritter dies bereits im Rahmen einer Vereinbarung mit dem ursprünglichen Anbieter getan hat [6].
Dies hat direkte Auswirkungen auf Unternehmen, die KI von Drittanbietern anpassen. Die Feinabstimmung des Modells eines Anbieters mit proprietären Daten, die Änderung seiner Ergebnisse durch zusätzliche Verarbeitungsschritte oder der Einsatz für einen Anwendungsfall, der erheblich vom angegebenen Verwendungszweck des Anbieters abweicht, können jeweils ausreichen, um eine Neueinstufung auszulösen.
Die Folgen einer solchen Neueinstufung sind weitreichend. Ein Anbieter trägt die volle Last der Pflichten aus dem EU-KI-Gesetz für Hochrisiko-Systeme, einschließlich Konformitätsbewertungen, technischer Dokumentation, Post-Market-Monitoring und der Registrierung in der EU-Datenbank. Diese Pflichten sind erheblich strenger als diejenigen, die Betreibern auferlegt werden.
Praktische Schritte zur Vermeidung dieser Falle
Dokumentieren Sie den Verwendungszweck. Führen Sie genaue Aufzeichnungen über den vom Anbieter angegebenen Verwendungszweck des KI-Systems sowie über den tatsächlichen Anwendungsfall im Unternehmen. Jede Abweichung sollte von Rechts- und Compliance-Teams geprüft werden.
Bewerten Sie den Umfang von Anpassungen. Bevor Sie ein KI-System eines Drittanbieters feintunen, neu trainieren oder wesentlich verändern, sollten Sie prüfen, ob dies eine „wesentliche Veränderung“ im Sinne der Verordnung darstellt. Die Leitlinien der Europäischen Kommission zu diesem Punkt werden voraussichtlich weitere Klarheit schaffen, aber das Risiko besteht bereits heute [7].
Vertragliche Klarheit schaffen. Stellen Sie sicher, dass in der Anbietervereinbarung klar geregelt ist, welche Partei der Anbieter und welche der Betreiber ist, und legen Sie die Bedingungen fest, unter denen sich diese Einstufung ändern könnte.
Frühzeitig Rechtsrat einholen. Die Grenze zwischen Anbieter und Betreiber ist eine Frage der tatsächlichen Gegebenheiten, nicht der bloßen Bezeichnung. Sich in einem Vertrag als Betreiber zu bezeichnen, hebelt eine rechtliche Bewertung des tatsächlichen Handelns als Anbieter nicht aus.
Die Falle des Artikels 25 ist kein theoretisches Szenario. Da Unternehmen zunehmend KI-Systeme von Anbietern anpassen und feintunen, dürfte die Abgrenzung zwischen Betrieb und Bereitstellung zu einem der am heftigsten umstrittenen Bereiche der KI-Regulierung werden.
Aufbau eines rechtssicheren Programms für Drittanbieter-KI
Die Risikobewertung von KI-Drittanbietern ist kein bloßer Punkt auf einer To-Do-Liste im Einkauf. Sie ist eine fortlaufende Governance-Disziplin, die rechtliche, technische und operative Bereiche umfasst. Unternehmen, die dieses Risiko effektiv managen, werden diejenigen sein, die die Überwachung von KI-Anbietern mit der gleichen Sorgfalt behandeln wie Finanzkontrollen oder den Datenschutz.
Das hier skizzierte Framework bietet einen Ausgangspunkt: Eine strukturierte Bewertung, präzise Fragen, vertragliche Absicherungen, kontinuierliche Überwachung und ein Bewusstsein für die regulatorischen Fallstricke, die einen Betreiber über Nacht in einen Anbieter verwandeln können. Nichts davon ist für Organisationen, die Hochrisiko-KI-Systeme in regulierten Umfeldern einsetzen, optional.
Für Unternehmen, die die Governance von KI-Drittanbietern skalierbar umsetzen möchten, bietet Enzai die Plattform-Infrastruktur, um Bewertungen von Anbietern zu verwalten, Verpflichtungen nachzuverfolgen und die kontinuierliche Kontrolle über das gesamte KI-Portfolio hinweg zu behalten. Fordern Sie eine Demo an, um zu sehen, wie dies in der Praxis funktioniert.
Enzai ist die führende Plattform für KI-Governance in Unternehmen (Enterprise AI Governance), speziell entwickelt, um Organisationen beim Übergang von abstrakten Richtlinien zur operativen Aufsicht zu unterstützen. Unsere Plattform für KI-Risikomanagement bietet die spezialisierte Infrastruktur, die für die Steuerung der Governance agentischer KI, die Pflege eines umfassenden KI-Inventars und die Gewährleistung der Compliance mit dem EU-KI-Gesetz erforderlich ist. Durch die Automatisierung komplexer Workflows ermöglicht Enzai es Unternehmen, die Einführung von KI mit Vertrauen zu skalieren und gleichzeitig die Ausrichtung an globalen Standards wie ISO 42001 und NIST zu wahren.
Referenzen
[1] Gartner, „Gartner Predicts 70% of Organisations Will Shift Focus to AI Governance,“ 2024.
[2] Europäisches Parlament und Rat, Verordnung (EU) 2024/1689 (EU-KI-Gesetz), Artikel 26 – Pflichten der Betreiber von Hochrisiko-KI-Systemen, 2024.
[3] Europäischer Datenschutzausschuss, „Opinion on the Interplay Between the AI Act and the GDPR,“ 2024.
[4] Europäisches Parlament und Rat, Verordnung (EU) 2024/1689 (EU-KI-Gesetz), Artikel 13 (Transparenz und Bereitstellung von Informationen für Betreiber) und Artikel 26 (Pflichten der Betreiber), 2024.
[5] Europäischer Datenschutzausschuss, „Guidelines on the Use of Personal Data in AI Model Training,“ 2025.
[6] Europäisches Parlament und Rat, Verordnung (EU) 2024/1689 (EU-KI-Gesetz), Artikel 25 – Verantwortlichkeiten in der KI-Wertschöpfungskette, 2024.
[7] Europäische Kommission, „Guidelines on Substantial Modification of AI Systems“ (ausstehend), referenziert im Erwägungsgrund 88 des EU-KI-Gesetzes.
Ermöglichen Sie Ihrer Organisation die Einführung, Steuerung und Überwachung von KI mit unternehmensgerechtem Vertrauen. Entwickelt für regulierte Organisationen, die im großen Maßstab operieren.

