Zum Inhalt springen
Start/Experten-Center/Glossar/Finetuning (LLM): Definition & Erklärung — Glossar

Finetuning (LLM): Definition & Erklärung — Glossar

Was ist Finetuning bei LLMs?

Finetuning (dt. Feinabstimmung) bezeichnet den Prozess, ein bereits vortrainiertes Large Language Model (LLM) auf einem kleineren, spezialisierten Datensatz weiter zu trainieren. Dabei werden die Gewichte des Modells angepasst, um es besser auf eine bestimmte Aufgabe, Domäne oder einen bestimmten Kommunikationsstil auszurichten.

Warum Finetuning statt Prompting?

Prompt Engineering erzielt mit den richtigen Anweisungen bereits gute Ergebnisse. Finetuning ist dann sinnvoll, wenn: das Modell konsistent einem bestimmten Tonfall oder Format folgen soll, spezifisches Domänenwissen dauerhaft eingebettet werden soll, Prompt-Längen reduziert werden sollen (weniger Tokens = geringere API-Kosten) oder das Modell spezifische Aufgaben zuverlässiger als durch Prompting lösen soll.

Methoden des Finetunings

Full Finetuning trainiert alle Modellgewichte — sehr leistungsfähig, aber rechenintensiv. Parameter-Efficient Fine-Tuning (PEFT) wie LoRA (Low-Rank Adaptation) trainiert nur einen kleinen Teil der Gewichte mit hoher Effizienz. Instruction Tuning passt das Modell an Anweisung-Antwort-Paare an. RLHF (Reinforcement Learning from Human Feedback) trainiert das Modell anhand menschlicher Bewertungen.

Abgrenzung zu RAG

Finetuning und RAG (Retrieval Augmented Generation) adressieren unterschiedliche Probleme. Finetuning bringt dem Modell dauerhaft Wissen und Verhalten bei. RAG liefert dem Modell zur Laufzeit aktuelle, spezifische Dokumente als Kontext. Für häufig aktualisierte Unternehmensinformationen ist RAG oft die bessere Wahl; für stabile Fach- oder Verhaltensanpassungen Finetuning.

Zurück zum Experten-Center