Reproduzierbarkeit
Die Fähigkeit, KI-Modellergebnisse unter Verwendung derselben Daten, Codes und Konfigurationen konsistent zu regenerieren und so Transparenz und Überprüfbarkeit zu gewährleisten.
Definition
Erfordert eine strenge Versionskontrolle von Code, Daten und Umgebung (Abhängigkeiten, Hardware). Automatisierte Pipelines erfassen Versuchsmetadaten (zufällige Startwerte, Hyperparameter), registrieren Artefakte in Modellregistern und ermöglichen exakte Wiederholungen. Die Governance-Rahmenbedingungen schreiben Reproduzierbarkeitsstandards für alle Produktionsmodelle vor. Regelmäßige Audits der Reproduzierbarkeit und der Verfahren zur Behebung allfälliger Abweichungen sind erforderlich.
Real-World Example
Ein Forschungslabor verwendet MLflow, um den Datensatz-Hash, die Code-Commit-ID, die Python-Umgebung und den zufälligen Startwert jedes Experiments zu protokollieren. Sechs Monate später führten Auditoren erfolgreich ein kritisches Experiment erneut durch und reproduzierten die veröffentlichte Genauigkeit — so wurde die vollständige Rückverfolgbarkeit und Reproduzierbarkeit nachgewiesen.