Verwaltung von Metadaten

Die Praxis der Erfassung und Pflege beschreibender Daten (z. B. Datenherkunft, Merkmalsdefinitionen, Modellparameter) zur Unterstützung der Rückverfolgbarkeit und Audits.

Definition

Implementierung von Metadatenregistern, die Abstammungsinformationen (Quelldatensätze, Transformationsschritte), Merkmalskataloge (Definitionen, Datentypen), Modellartefakte (Hyperparameter, Trainingscodeversionen) und Nutzungsprotokolle sammeln. Die Unternehmensleitung schreibt die obligatorische Erfassung von Metadaten in jeder Phase der Pipeline vor, integriert Überprüfungen der Metadaten und stellt Such- und Berichtsschnittstellen bereit, über die Interessengruppen Audits und Wirkungsanalysen durchführen können.

Real-World Example

Eine pharmazeutische ML-Plattform verwendet einen Metadatenspeicher, um Folgendes zu protokollieren: Datensatzversionen, Feature-Engineering-Skripte, Git-Commits für das Modelltraining und Zeitstempel der Bereitstellung. Wenn die Leistung eines Modells nachlässt, fragen die Ermittler den Metadatenspeicher ab, um die genauen Daten- oder Codeänderungen zu ermitteln, die dafür verantwortlich sind.