Verwaltung von Metadaten
Die Praxis der Erfassung und Pflege beschreibender Daten (z. B. Datenherkunft, Merkmalsdefinitionen, Modellparameter) zur Unterstützung der Rückverfolgbarkeit und Audits.
Definition
Implementierung von Metadatenregistern, die Abstammungsinformationen (Quelldatensätze, Transformationsschritte), Merkmalskataloge (Definitionen, Datentypen), Modellartefakte (Hyperparameter, Trainingscodeversionen) und Nutzungsprotokolle sammeln. Die Unternehmensleitung schreibt die obligatorische Erfassung von Metadaten in jeder Phase der Pipeline vor, integriert Überprüfungen der Metadaten und stellt Such- und Berichtsschnittstellen bereit, über die Interessengruppen Audits und Wirkungsanalysen durchführen können.
Real-World Example
Eine pharmazeutische ML-Plattform verwendet einen Metadatenspeicher, um Folgendes zu protokollieren: Datensatzversionen, Feature-Engineering-Skripte, Git-Commits für das Modelltraining und Zeitstempel der Bereitstellung. Wenn die Leistung eines Modells nachlässt, fragen die Ermittler den Metadatenspeicher ab, um die genauen Daten- oder Codeänderungen zu ermitteln, die dafür verantwortlich sind.