Überanpassung

Ein Modellierungsproblem, bei dem ein KI-System Geräusche oder Eigenheiten in Trainingsdaten lernt und so seine Fähigkeit zur Generalisierung auf neue, unsichtbare Daten reduziert.

Definition

Tritt auf, wenn die Modellkomplexität (zu viele Parameter) das Auswendiglernen von Trainingsbeispielen ermöglicht, anstatt allgemeine Muster zu lernen. Zu den Symptomen gehören eine hohe Trainingsgenauigkeit, aber eine geringe Validierungs-/Testleistung. Zu den Kontrollpraktiken gehören regelmäßige Kreuzvalidierungen, die Überwachung der Unterschiede zwischen Trainingsverlauf und Validierung, die Anwendung von Regularisierungstechniken (Studienabbruch, Gewichtsabbau) und die Definition akzeptabler Generalisierungslücken, bevor die Modelle in Produktion gehen.

Real-World Example

Eine selbstfahrende KI zeigt in der Simulation eine Erkennungsgenauigkeit von 99%, bei realen Testfahrten jedoch nur 70%. Techniker diagnostizieren Überpassungen, fügen Aussetzerschichten hinzu, ergänzen das Training mit unterschiedlichen Lichtverhältnissen und trainieren erneut. Vor dem Einsatz erreichen sie sowohl bei simulierten als auch bei realen Tests eine ausgeglichene Genauigkeit von 90%.