Generalisierung

Die Fähigkeit eines KI-Modells, bei neuen, unsichtbaren Daten gute Ergebnisse zu erzielen, indem es zugrunde liegende Muster erfasst, anstatt Trainingsbeispiele auswendig zu lernen.

Definition

Die Kerneigenschaft, die effektive Modelle von überfitten Modellen unterscheidet. Die Generalisierung wird durch geeignete Modellkapazitäten, Regularisierungstechniken (Dropout, Gewichtsabbau), Datenerweiterung und robuste Validierung (Kreuzvalidierung, Hold-Out-Sets) erreicht. Die Steuerung umfasst die Überwachung von Generalisierungslücken (Train-Fehler im Vergleich zu Validierungsfehlern), die Festlegung akzeptabler Schwellenwerte und die Umschulung der Modelle, wenn die Leistung der Produktionsdaten erheblich von den Testergebnissen abweicht.

Real-World Example

Ein Bildklassifizierungsteam stellt fest, dass die Trainingsgenauigkeit seines Modells bei 99% liegt, die Testgenauigkeit jedoch bei 75% liegt. Sie führen eine Datenvergrößerung ein (Rotationen, Farbjitter), tragen Dropout-Schichten auf und trainieren erneut. So wird eine ausgewogene Genauigkeit von Training und Test von etwa 90% erreicht, was eine verbesserte Generalisierung vor der Bereitstellung demonstriert.