Zum Inhalt springen
Start/Experten-Center/Glossar/Datenqualität: Definition & Erklärung — Glossar

Datenqualität: Definition & Erklärung — Glossar

Was ist Datenqualität?

Datenqualität beschreibt das Ausmaß, in dem Daten für ihren beabsichtigten Verwendungszweck geeignet sind. Hochwertige Daten sind korrekt (stimmen mit der Realität überein), vollständig (keine relevanten Lücken), konsistent (keine Widersprüche zwischen Systemen), aktuell (spiegeln den gegenwärtigen Zustand wider) und eindeutig (keine Mehrdeutigkeiten).

Dimensionen der Datenqualität

Die sechs klassischen Dimensionen sind: Genauigkeit (Accuracy), Vollständigkeit (Completeness), Konsistenz (Consistency), Aktualität (Timeliness), Eindeutigkeit (Uniqueness) und Gültigkeit (Validity). Jede Dimension wird mit spezifischen Metriken gemessen. Eine Fehlerrate von mehr als 2 % in kritischen Stammdaten gilt bereits als bedenklich und beeinträchtigt Entscheidungsprozesse messbar.

Auswirkungen schlechter Datenqualität

Schlechte Datenqualität ist einer der häufigsten Gründe für das Scheitern von KI- und Analytics-Projekten. Ein Sprachmodell, das auf fehlerhaften Daten trainiert wird, produziert fehlerhafte Ergebnisse. Im ERP führen Duplikate und Fehler in Stammdaten zu falschen Bestellungen, Fehllieferungen und Compliance-Problemen. Schätzungen zufolge kostet schlechte Datenqualität Unternehmen durchschnittlich 15–25 % ihres Umsatzes durch Effizienzeinbußen.

Datenqualität verbessern

Verbesserungsmaßnahmen umfassen: Validierungsregeln direkt bei der Dateneingabe, ETL-Prozesse mit integrierten Qualitätsprüfungen, regelmäßige Daten-Audits und Deduplizierungsläufe, Master Data Management (MDM) als Single Source of Truth sowie Data Profiling-Tools, die Datenqualitätsprobleme automatisch erkennen und quantifizieren.

Zurück zum Experten-Center