Fuzzy-Suche: Definition & Erklärung — Glossar
Was ist Fuzzy-Suche?
Fuzzy-Suche (auch Unschärfesuche oder approximate string matching) ist eine Suchtechnik, die Treffer findet, die dem Suchbegriff ähnlich, aber nicht identisch sind. Sie toleriert Tippfehler, alternative Schreibweisen, Umlaute und Abweichungen in der Wortlänge. Damit überwindet sie die Einschränkungen exakter Volltextsuche, die nur bei perfekter Übereinstimmung anschlägt.
Algorithmen hinter der Fuzzy-Suche
Die Levenshtein-Distanz misst die minimale Anzahl von Einfüge-, Lösch- und Ersetzoperationen, um einen String in einen anderen umzuwandeln. “Müler” und “Müller” haben eine Levenshtein-Distanz von 1. Phonetische Algorithmen (Soundex, Metaphone) matchen Wörter, die ähnlich klingen, aber unterschiedlich geschrieben werden. N-Gramm-basierte Methoden zerlegen Strings in Zeichengruppen und vergleichen diese.
Einsatzgebiete
Fuzzy-Suche ist wertvoll in Suchfeldern (E-Commerce, Wissensdatenbanken), bei der Deduplizierung von Adress- und Kundendaten, bei der Normalisierung von Stammdaten (verschiedene Schreibweisen desselben Lieferanten) und im Master Data Management. Suchmaschinen wie Elasticsearch bieten Fuzzy-Suche als Standardfunktion. Tools zur Datenqualität nutzen Fuzzy Matching zur automatischen Erkennung von Dubletten.
Grenzen und Konfiguration
Eine zu hohe Toleranz liefert zu viele falsche Treffer, eine zu niedrige verfehlt den Zweck. Der Toleranzparameter (max. Levenshtein-Distanz, meist 1–2 für Suchen) muss je nach Anwendungsfall kalibriert werden. Semantische Suche über Embeddings ergänzt Fuzzy-Suche sinnvoll, wenn nicht nur Tippfehler, sondern auch bedeutungsähnliche Begriffe gefunden werden sollen.