Bias (KI-Systeme): Definition & Erklärung — Glossar
Was ist Bias in KI-Systemen?
Bias (dt. Verzerrung) in KI-Systemen bezeichnet systematische Fehler in Machine-Learning-Modellen, die durch verzerrte Trainingsdaten, fehlerhafte Modelldesigns oder problematische Evaluierungsmethoden entstehen. Das Ergebnis sind Vorhersagen oder Entscheidungen, die bestimmte Gruppen bevorzugen oder benachteiligen, ohne dass dies intendiert war.
Ursachen von KI-Bias
Bias entsteht hauptsächlich durch unrepräsentative Trainingsdaten: Wenn historische Daten gesellschaftliche Ungleichheiten widerspiegeln, lernt das Modell diese Ungleichheiten als Norm. Weitere Ursachen sind Auswahl-Bias (bestimmte Datengruppen sind unterrepräsentiert), Mess-Bias (fehlerhafte Datenlabels) und Algorithmus-Bias (strukturelle Modellentscheidungen, die bestimmte Merkmale übergewichten).
Arten von Bias
Wichtige Bias-Typen umfassen: Bestätigungs-Bias (Modell bevorzugt Hypothesen, die mit Trainingsdaten übereinstimmen), Gruppen-Bias (systematische Benachteiligung demografischer Gruppen), historischer Bias (vergangene Diskriminierung wird reproduziert) und Automatisierungs-Bias (Menschen vertrauen KI-Empfehlungen blind, auch wenn sie falsch sind).
Erkennung und Mitigation
Bias-Erkennung erfordert systematische Evaluierung von Modellausgaben über verschiedene Subgruppen hinweg. Methoden wie Fairness-Metriken, diversere Trainingssets, Re-Weighting von Datenpunkten und Explainability-Techniken (XAI) helfen, Bias zu identifizieren und zu reduzieren. Für Unternehmen ist Bias-Management nicht nur eine ethische, sondern auch eine rechtliche Anforderung — die EU-KI-Verordnung schreibt Risikobewertungen für Hochrisiko-KI vor.