Implizite Voreingenommenheit

Unbewusste oder unbeabsichtigte Vorurteile, die in Trainingsdaten oder im Modelldesign eingebettet sind und zu diskriminierenden Ergebnissen führen können.

Definition

Vorurteile, die durch gesellschaftliche, kulturelle oder stichprobenartige Faktoren verursacht werden und die durch Datenkurationsprozesse nicht aktiv zum Vorschein kommen. Implizite Vorurteile können in den Urteilen der Labels oder in historischen Aufzeichnungen lauern. Die Regierung fordert blinde Kennzeichnungsprotokolle, verschiedene Annotationsteams und regelmäßige Scans zur Erkennung von Vorurteilen, um diese versteckten Ursachen unfairer Ergebnisse aufzudecken und zu korrigieren.

Real-World Example

Ein Modell der Stimmungsanalyse, das auf Social-Media-Posts trainiert wurde, spiegelt eine implizite Voreingenommenheit wider: Beiträge aus bestimmten Dialekten werden negativer gekennzeichnet. Das Team führt eine blinde Kennzeichnung ein (entfernt die Metadaten des Autors) und rekrutiert verschiedene Kommentatoren, wodurch die Fehlklassifizierungsraten für dialektalen Text um 40% reduziert werden.