Open-Source LLM Fine-Tuning für Entwickler
Domänenspezifische Open-Source LLMs mit LoRA, DPO, Evaluation und Serving sicher umsetzen
Die wichtigsten Themen
LoRA und QLoRA sicher einsetzen
SFT-Datasets versioniert aufbauen
DPO mit Preference-Daten anwenden
Evaluation mit Golden Sets planen
vLLM und TGI für Serving nutzen
Prompt-Injection-Risiken bewerten
Überblick In dieser Advanced-Schulung lernst du, Open-Source LLM Fine-Tuning strukturiert für reale Entwicklungs- und Produktumgebungen umzusetzen. Im Mittelpunkt stehen domänenspezifische Sprachmodelle, belastbare Datensätze,...
In dieser Advanced-Schulung lernst du, Open-Source LLM Fine-Tuning strukturiert für reale Entwicklungs- und Produktumgebungen umzusetzen. Im Mittelpunkt stehen domänenspezifische Sprachmodelle, belastbare Datensätze, reproduzierbare Trainingsläufe und der stabile Betrieb nach dem Training. Statt Modelle per Trial-and-Error anzupassen, arbeitest du mit klaren Entscheidungsregeln: Wann reicht Prompting, wann ist RAG sinnvoller, wann lohnt sich SFT mit LoRA oder QLoRA und wann bringt Preference Tuning mit DPO einen messbaren Qualitätsgewinn?
Das Seminar führt dich von der Modell- und Trainingsstrategie über Instruction-Datasets, Quality Gates, Hugging Face Transformers und TRL bis zu Evaluation, Quantisierung und Serving mit vLLM oder TGI. Dabei bleiben Betriebsfragen wie Versionierung, Rollback, Prompt-Injection-Risiken, Data Exfiltration und Monitoring durchgehend Teil des Workflows. Wenn du deine Grundlagen vorher festigen möchtest, passen der Python Aufbaukurs, der Python Machine Learning Grundkurs oder das Seminar Transfer Learning als Vorbereitung. Für den produktiven Betrieb von KI-Anwendungen ergänzt KI-Apps containerisieren mit Podman, Docker & Kubernetes die Deployment-Perspektive.
Die Themen Use-Case-Scoping für Chat, RAG, Tool-Use und Klassifikation · Abgrenzung von Prompting, RAG, SFT, Preference Tuning und Full Fine-Tuning · Auswahl geeigneter Base Models wie Llama, Mistral oder Qwen...
Modell- und Trainingsstrategie
- Use-Case-Scoping für Chat, RAG, Tool-Use und Klassifikation
- Abgrenzung von Prompting, RAG, SFT, Preference Tuning und Full Fine-Tuning
- Auswahl geeigneter Base Models wie Llama, Mistral oder Qwen
- Lizenz-, Compliance- und Deployment-Aspekte bei Open-Source LLMs
- Compute-Kalkulation für VRAM, Durchsatz, Trainingsdauer und Kosten
- Entscheidungskriterien für PEFT, LoRA, QLoRA und vollständiges Fine-Tuning
Datendesign und Qualitätssicherung
- Aufbau von Instruction-Datasets mit Rollen, Systemregeln und Prompt-Formaten
- Definition von Zielverhalten, Ablehnungslogik und Policy-Style für Modellantworten
- Deduplication, Leakage-Prüfung, Toxicity-Checks und Umgang mit PII
- Labeling-Guidelines, Review-Prozesse und Inter-Annotator-Checks
- Data Mixing aus Domain-Daten, General-Daten, Safety-Beispielen und Hard Negatives
- Datensatz-Versionierung, Quality Gates und reproduzierbare Trainingsstände
Supervised Fine-Tuning mit PEFT
- LoRA- und QLoRA-Konzepte mit Rank, Alpha, Target Modules und Adapter-Struktur
- Tokenisierung, Chat Templates, Packing, Sequence Length und Loss Masking
- Training mit Hugging Face Transformers, TRL und typischen SFT-Konfigurationen
- Hyperparameter-Entscheidungen für Learning Rate, Batch Size und Gradient Accumulation
- Stabilisierung von Trainingsläufen mit Checkpoints, Seeds und Run-Protokollen
- Analyse von Trainingssignalen, Overfitting-Risiken und Regressionsmustern
Preference Tuning mit DPO
- Aufbau von Pairwise-Preference-Daten mit Chosen- und Rejected-Antworten
- DPO-Grundidee, Beta-Konfiguration und typische Fehlerquellen
- Sampling-Strategien für Präferenzdaten und Umgang mit widersprüchlichen Labels
- Vergleich von DPO mit Alternativen wie ORPO, IPO und Best-of-N Sampling
- Guardrails für Ablehnungen, Safety-Prompts und policy-konformes Antwortverhalten
- Bewertung von Preference-Tuning-Ergebnissen jenseits subjektiver Einzelbeispiele
Evaluation und Regression Tests
- Offline-Evaluation mit Task-Suites, Golden Sets und domänenspezifischen Testfällen
- Regression Tests für Antwortqualität, Formatstabilität, Sicherheitsverhalten und Tool-Use
- LLM-as-a-Judge mit Kalibrierung, Bias-Prüfung und Gegenchecks
- Halluzinationsmessung in RAG-Setups und Abgleich mit Referenzquellen
- Metriken für Drift, Latency, Cost per Answer und Fehlerklassen
- Entscheidungsgrundlagen für Modellfreigabe, Rollback und weitere Trainingsiteration
Deployment, Serving und Betrieb
- Export von Adaptern, Adapter-Merge und Vorbereitung von Release-Artefakten
- Quantisierung mit GPTQ oder AWQ für effiziente Inferenz
- Serving mit vLLM und TGI inklusive Batching, KV-Cache und Streaming
- Sicherheitsbetrachtung zu Prompt Injection, Data Exfiltration und Secrets
- Modellkarten, Versionierung, Release-Prozess und Rollback-Strategien
- Monitoring von Qualität, Kosten, Latenz und produktionsnahen Betriebsmetriken
Wer hier richtig ist
- Softwareentwicklerinnen, Softwareentwickler und Machine-Learning-Engineers, die Open-Source LLMs für interne oder kundenspezifische Anwendungen anpassen
- AI Engineers und Produktteams, die Qualität, Evaluation, Guardrails und Betrieb von LLM-basierten Features verantworten
- Data Scientists mit Erfahrung in Python und Machine Learning, die SFT, LoRA, QLoRA und DPO in reproduzierbare Workflows überführen
- Plattform-, MLOps- und DevOps-Teams, die Modell-Serving, Monitoring, Versionierung und sichere Releases vorbereiten
Das lernst du
- Fundierte Entscheidung, ob Prompting, RAG, SFT, DPO oder ein kombinierter Ansatz für deinen Use Case geeignet ist
- Instruction- und Preference-Datasets mit Quality Gates, Versionierung und klaren Labeling-Regeln aufbauen
- Open-Source LLMs mit LoRA oder QLoRA trainieren und Trainingsläufe reproduzierbar dokumentieren
- Evaluationen mit Golden Sets, Regression Tests und LLM-as-a-Judge methodisch belastbar planen
- Fine-Tuning-Ergebnisse mit Quantisierung, vLLM oder TGI in einen stabilen Inferenzbetrieb überführen
- Sicherheits- und Betriebsrisiken wie Prompt Injection, Datenabfluss, Drift und Rollback systematisch berücksichtigen
So arbeiten wir
- Trainer-Input mit Live-Demos zu Modellwahl, Datendesign, SFT, DPO, Evaluation und Serving
- Geführte Hands-on-Labs in bereitgestellten GPU-, VM- und Tool-Umgebungen
- Praxisübungen mit Hugging Face Transformers, TRL, LoRA/QLoRA und DPO-Konfigurationen
- Mini-Workshops zu Quality Gates, Golden Sets, Metriken und Release-Entscheidungen
- Checklisten und Templates für Datensatz-Aufbau, Trainingsprotokolle, Modellkarten und Rollback
- Gemeinsame Auswertung typischer Fehlerbilder aus Training, Evaluation und Inferenzbetrieb
Empfohlene Vorkenntnisse
- Solide Python-Kenntnisse, idealerweise auf Niveau des Python Aufbaukurses
- Erfahrung mit CLI, Git und reproduzierbaren Entwicklungsabläufen, beispielsweise aus Git, GitLab und CI/CD
- Grundverständnis von Transformer-Modellen, Tokenisierung und ML-Training
- Vertrautheit mit Begriffen wie Loss, Epoch, Overfitting, Checkpoint und Hyperparameter
Dein Fahrplan
Der erste Tag schafft die Grundlage für belastbare Fine-Tuning-Entscheidungen. Behandelt werden Use-Case-Scoping, Erfolgskriterien, Abgrenzung von Prompting, RAG, SFT und Full Fine-Tuning sowie die Auswahl geeigneter Base Models. Dazu kommen Lizenz- und Compliance-Aspekte, Compute-Planung, VRAM-Bedarf, Kostenabschätzung und PEFT-Strategien. Im Datenblock entstehen Instruction-Formate, Labeling-Guidelines, Quality Gates und Ansätze für Data Mixing, Deduplication, Leakage-Prüfung, PII-Kontrolle und Datensatz-Versionierung.
Organisatorisches
Lernformate
Unsere Seminare bieten dir maximale Flexibilität: Du kannst zwischen Live-Online und Vor Ort in unseren modernen Schulungszentren im D-A-CH Raum wählen. Beide Formate garantieren dir die gleiche hohe Qualität und interaktive Lernerfahrung.
Schulungsarten
Wir bieten dir verschiedene Schulungsarten: Offene Seminare, Firmenseminare für Teams und Inhouse-Schulungen direkt bei dir vor Ort. So findest du genau das Format, das zu deinen Bedürfnissen passt.
Uhrzeiten
9:00-16:00 Uhr
Aktuelle Software
In unseren offenen Kursen arbeiten wir mit der aktuellsten Software-Version. So lernst du direkt mit den Tools und Features, die du auch in deinem Arbeitsalltag verwendest - praxisnah und zukunftsorientiert. Bei Inhouse- und Firmenschulungen bestimmt ihr die Version.
Deine Vorteile
Zufriedenheitsgarantie
Wir sind von unserer Qualität überzeugt. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.
Inklusivleistungen
Deine Teilnahme beinhaltet: Schulungsmaterial, Zertifikat, Verpflegung (bei Präsenzveranstaltungen) und persönliche Betreuung durch unsere Trainer und unser Orga-Team. Alles aus einer Hand - keine versteckten Kosten.
Lernen von Experten
Unsere Trainer sind zertifizierte und erfahrene Profis mit jahrelanger Berufserfahrung. Sie vermitteln dir in den Kursen nicht nur theoretisches Wissen, sondern teilen ihre Erfahrungen aus realen Projekten und helfen dir, das Gelernte direkt in deiner täglichen Arbeit anzuwenden. Das ist kein Werbeversprechen, sondern unser Anspruch. Am besten siehst du das in unseren Bewertungen, z.B. auch bei Google.
Keine Vorkasse
Du zahlst erst nach dem Seminar. Keine Vorkasse, keine Vorauszahlung - so kannst du sicher sein, dass du nur für das bezahlst, was du auch wirklich erhalten hast. Die Rechnung erhältst du erst nach Kursbeginn.
Max. 8 Teilnehmende
Wir setzen auf kleine Gruppen, damit du die Aufmerksamkeit bekommst, die du verdienst. So haben wir mehr Zeit für deine individuellen Fragen und können gezielt auf deine Bedürfnisse eingehen.
Termine & Buchung
Vor Ort
Online
Nicht der passende Termin dabei?
Wir finden eine Lösung: anderer Termin, mehrere Teilnehmer, Inhouse-Schulung oder individuelle Beratung.
Lieber gleich das ganze Team schulen?
Diese Schulung gibt es auch exklusiv für dein Unternehmen, bei euch vor Ort, an unseren Standorten oder Live-Online. Inhalte und Termine nach Maß.
Inhouse-Schulung
Wir kommen zu euch: diese Schulung maßgeschneidert in euren Räumen, für Unternehmen und Behörden.
- Inhalte exakt auf euch zugeschnitten
- Termine nach euren Bedürfnissen
- Günstiger ab mehreren Teilnehmern
- Vertraute Umgebung, kein Reiseaufwand
Firmen-Seminar
Exklusiv für dein Team an einem unserer Standorte oder Live-Online, individuell angepasst.
- Geschlossene Gruppe aus eurem Haus
- Individuelle Terminplanung
- An unseren Standorten oder Live-Online
- Angepasste Inhalte
Fragen und Antworten zu Open-Source LLM Fine-Tuning für Entwickler
Für wen eignet sich die Open-Source LLM Fine-Tuning Schulung?
Die Schulung richtet sich an Entwicklerinnen, Entwickler, Machine-Learning-Engineers, AI Engineers, Data Scientists und MLOps-Teams, die Open-Source LLMs nicht nur testen, sondern reproduzierbar an Domänen, Produkte oder interne Prozesse anpassen möchten. Besonders passend ist das Seminar, wenn du bereits erste LLM-Prototypen kennst und nun belastbare Trainings-, Evaluations- und Betriebsabläufe brauchst.
Welche Vorkenntnisse sind für LoRA, QLoRA und DPO notwendig?
Erforderlich sind solide Python-Kenntnisse, Erfahrung mit CLI und Git sowie ein Grundverständnis von Transformer-Modellen, Tokenisierung und ML-Training. Begriffe wie Loss, Epoch, Overfitting und Checkpoint sollten vertraut sein. Für die Vorbereitung eignen sich der Python Aufbaukurs und der Python Machine Learning Grundkurs.
Brauche ich eigene GPUs oder spezielle Lizenzen?
Nein. Falls für Übungen erforderlich, werden dir VMs, GPUs und die benötigte Software bereitgestellt. Du brauchst keine eigene GPU-Hardware, keine zusätzlichen Lizenzen und kein spezielles Notebook. Im Seminar wird außerdem besprochen, wie VRAM, Durchsatz, Trainingszeit und Kosten für eigene Fine-Tuning-Projekte realistisch eingeschätzt werden.
Welche Open-Source LLMs werden im Seminar behandelt?
Gearbeitet wird exemplarisch mit verbreiteten Open-Source LLM-Familien wie Llama, Mistral oder Qwen. Die konkrete Modellvariante richtet sich nach Verfügbarkeit, Übungsziel, Hardware-Anforderungen und Lizenzrahmen. Wichtiger als ein einzelnes Modell ist der übertragbare Workflow von Modellwahl, Datensatz-Aufbau, Training, Evaluation und Deployment.
Geht es in der Schulung auch um RAG?
RAG ist nicht der Hauptinhalt, wird aber an den relevanten Schnittstellen behandelt. Dazu gehören Use-Case-Abgrenzung, Datendesign, Halluzinationsmessung, Regression Tests, Guardrails und die Entscheidung, ob ein Problem besser über Retrieval, Fine-Tuning oder eine Kombination gelöst wird.
Was ist der Unterschied zwischen SFT und DPO?
Supervised Fine-Tuning trainiert ein Modell auf gewünschte Zielantworten und eignet sich besonders für Format, Tonalität, Domänenwissen und wiederkehrende Aufgabenmuster. Direct Preference Optimization nutzt bevorzugte und abgelehnte Antwortpaare, um das Antwortverhalten stärker an Qualitäts-, Sicherheits- oder Policy-Kriterien auszurichten. Im Seminar werden beide Verfahren praktisch eingeordnet und miteinander kombiniert.
Wie wird die Qualität eines feinabgestimmten LLM bewertet?
Die Bewertung erfolgt nicht nur über Einzelbeispiele. Du arbeitest mit Golden Sets, Task-Suites, Regression Tests, LLM-as-a-Judge mit Kalibrierung und Metriken für Halluzinationen, Latenz, Kosten und Drift. Ziel ist eine belastbare Entscheidungsgrundlage, ob ein Modell freigegeben, nachtrainiert oder zurückgerollt wird.
Ist das Seminar eher Forschung oder Produktentwicklung?
Der Schwerpunkt liegt auf Produktentwicklung und betrieblichen Abläufen. Du lernst Entscheidungsregeln, Quality Gates, Evaluation und Serving so einzusetzen, dass Fine-Tuning in Teams nachvollziehbar, wartbar und releasefähig bleibt. Forschungsdetails werden nur dort vertieft, wo sie für technische Entscheidungen im Projekt relevant sind.
Weitere häufig gestellte Fragen und Antworten findest du in den FAQs .
Ähnliche Kurse
Large Language Model Strategie: Alles für Entscheider
Large Language Models Advanced: Eigene LLMs und Tuning
Python mit Tensorflow: Grundkurs
Neo4j Graph-Datenbanken für KI
KI-gestützte Datenbanksuche: Aufbaukurs
Unser Qualitätsversprechen: Wissen, das in der Praxis funktioniert
Aus der Praxis für die Praxis
Schluss mit theoretischem Ballast. Wir trainieren dich für reale IT-Herausforderungen, nicht für Multiple-Choice-Tests. Unsere Trainer vermitteln dir genau das Wissen, das am nächsten Montagmorgen im Job wirklich funktioniert.
Individuell statt "Schema F"
Deine Fragen passen nicht ins Standard-Skript? Bei uns schon. Wir verzichten auf starre Lehrpläne und geben deinen konkreten Projekt-Fragen Raum. Unsere Trainer passen die Inhalte flexibel an das an, was dich und dein Team aktuell weiterbringt.
Maximale Freiheit: Remote oder vor Ort
Lerne so, wie es in deinen Alltag passt - ohne Reise-Stress und Zeitverlust. Egal ob remote, hybrid oder präsent vor Ort: Wir garantieren dir ein nahtloses und effektives Lernerlebnis, egal von wo du dich zuschaltest.
Mit Zufriedenheitsgarantie
Wir sind von unserer Qualität überzeugt - und wollen, dass du es auch bist. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.
Über 20.000 Unternehmen und Behörden vertrauen auf uns