Glossar19. Juni 20263 Min. Lesezeit

Bias (KI-Systeme): Definition & Erklärung — Glossar

Was ist Bias in KI-Systemen?

Bias (dt. Verzerrung) in KI-Systemen bezeichnet systematische Fehler in Machine-Learning-Modellen, die durch verzerrte Trainingsdaten, fehlerhafte Modelldesigns oder problematische Evaluierungsmethoden entstehen. Das Ergebnis sind Vorhersagen oder Entscheidungen, die bestimmte Gruppen bevorzugen oder benachteiligen, ohne dass dies intendiert war.

Ursachen von KI-Bias

Bias entsteht hauptsächlich durch unrepräsentative Trainingsdaten: Wenn historische Daten gesellschaftliche Ungleichheiten widerspiegeln, lernt das Modell diese Ungleichheiten als Norm. Weitere Ursachen sind Auswahl-Bias (bestimmte Datengruppen sind unterrepräsentiert), Mess-Bias (fehlerhafte Datenlabels) und Algorithmus-Bias (strukturelle Modellentscheidungen, die bestimmte Merkmale übergewichten).

Arten von Bias

Wichtige Bias-Typen umfassen: Bestätigungs-Bias (Modell bevorzugt Hypothesen, die mit Trainingsdaten übereinstimmen), Gruppen-Bias (systematische Benachteiligung demografischer Gruppen), historischer Bias (vergangene Diskriminierung wird reproduziert) und Automatisierungs-Bias (Menschen vertrauen KI-Empfehlungen blind, auch wenn sie falsch sind).

Erkennung und Mitigation

Bias-Erkennung erfordert systematische Evaluierung von Modellausgaben über verschiedene Subgruppen hinweg. Methoden wie Fairness-Metriken, diversere Trainingssets, Re-Weighting von Datenpunkten und Explainability-Techniken (XAI) helfen, Bias zu identifizieren und zu reduzieren. Für Unternehmen ist Bias-Management nicht nur eine ethische, sondern auch eine rechtliche Anforderung — die EU-KI-Verordnung schreibt Risikobewertungen für Hochrisiko-KI vor.

Zurück zum Experten-Center