Open-Source LLM Fine-Tuning für Entwickler
KI Engineering & LLMs

Open-Source LLM Fine-Tuning für Entwickler

Domänenspezifische Open-Source LLMs mit LoRA, DPO, Evaluation und Serving sicher umsetzen

Die wichtigsten Themen

LoRA und QLoRA sicher einsetzen

SFT-Datasets versioniert aufbauen

DPO mit Preference-Daten anwenden

Evaluation mit Golden Sets planen

vLLM und TGI für Serving nutzen

Prompt-Injection-Risiken bewerten

Überblick In dieser Advanced-Schulung lernst du, Open-Source LLM Fine-Tuning strukturiert für reale Entwicklungs- und Produktumgebungen umzusetzen. Im Mittelpunkt stehen domänenspezifische Sprachmodelle, belastbare Datensätze,...

In dieser Advanced-Schulung lernst du, Open-Source LLM Fine-Tuning strukturiert für reale Entwicklungs- und Produktumgebungen umzusetzen. Im Mittelpunkt stehen domänenspezifische Sprachmodelle, belastbare Datensätze, reproduzierbare Trainingsläufe und der stabile Betrieb nach dem Training. Statt Modelle per Trial-and-Error anzupassen, arbeitest du mit klaren Entscheidungsregeln: Wann reicht Prompting, wann ist RAG sinnvoller, wann lohnt sich SFT mit LoRA oder QLoRA und wann bringt Preference Tuning mit DPO einen messbaren Qualitätsgewinn?

Das Seminar führt dich von der Modell- und Trainingsstrategie über Instruction-Datasets, Quality Gates, Hugging Face Transformers und TRL bis zu Evaluation, Quantisierung und Serving mit vLLM oder TGI. Dabei bleiben Betriebsfragen wie Versionierung, Rollback, Prompt-Injection-Risiken, Data Exfiltration und Monitoring durchgehend Teil des Workflows. Wenn du deine Grundlagen vorher festigen möchtest, passen der Python Aufbaukurs, der Python Machine Learning Grundkurs oder das Seminar Transfer Learning als Vorbereitung. Für den produktiven Betrieb von KI-Anwendungen ergänzt KI-Apps containerisieren mit Podman, Docker & Kubernetes die Deployment-Perspektive.

Die Themen Use-Case-Scoping für Chat, RAG, Tool-Use und Klassifikation · Abgrenzung von Prompting, RAG, SFT, Preference Tuning und Full Fine-Tuning · Auswahl geeigneter Base Models wie Llama, Mistral oder Qwen...

Modell- und Trainingsstrategie

  • Use-Case-Scoping für Chat, RAG, Tool-Use und Klassifikation
  • Abgrenzung von Prompting, RAG, SFT, Preference Tuning und Full Fine-Tuning
  • Auswahl geeigneter Base Models wie Llama, Mistral oder Qwen
  • Lizenz-, Compliance- und Deployment-Aspekte bei Open-Source LLMs
  • Compute-Kalkulation für VRAM, Durchsatz, Trainingsdauer und Kosten
  • Entscheidungskriterien für PEFT, LoRA, QLoRA und vollständiges Fine-Tuning

Datendesign und Qualitätssicherung

  • Aufbau von Instruction-Datasets mit Rollen, Systemregeln und Prompt-Formaten
  • Definition von Zielverhalten, Ablehnungslogik und Policy-Style für Modellantworten
  • Deduplication, Leakage-Prüfung, Toxicity-Checks und Umgang mit PII
  • Labeling-Guidelines, Review-Prozesse und Inter-Annotator-Checks
  • Data Mixing aus Domain-Daten, General-Daten, Safety-Beispielen und Hard Negatives
  • Datensatz-Versionierung, Quality Gates und reproduzierbare Trainingsstände

Supervised Fine-Tuning mit PEFT

  • LoRA- und QLoRA-Konzepte mit Rank, Alpha, Target Modules und Adapter-Struktur
  • Tokenisierung, Chat Templates, Packing, Sequence Length und Loss Masking
  • Training mit Hugging Face Transformers, TRL und typischen SFT-Konfigurationen
  • Hyperparameter-Entscheidungen für Learning Rate, Batch Size und Gradient Accumulation
  • Stabilisierung von Trainingsläufen mit Checkpoints, Seeds und Run-Protokollen
  • Analyse von Trainingssignalen, Overfitting-Risiken und Regressionsmustern

Preference Tuning mit DPO

  • Aufbau von Pairwise-Preference-Daten mit Chosen- und Rejected-Antworten
  • DPO-Grundidee, Beta-Konfiguration und typische Fehlerquellen
  • Sampling-Strategien für Präferenzdaten und Umgang mit widersprüchlichen Labels
  • Vergleich von DPO mit Alternativen wie ORPO, IPO und Best-of-N Sampling
  • Guardrails für Ablehnungen, Safety-Prompts und policy-konformes Antwortverhalten
  • Bewertung von Preference-Tuning-Ergebnissen jenseits subjektiver Einzelbeispiele

Evaluation und Regression Tests

  • Offline-Evaluation mit Task-Suites, Golden Sets und domänenspezifischen Testfällen
  • Regression Tests für Antwortqualität, Formatstabilität, Sicherheitsverhalten und Tool-Use
  • LLM-as-a-Judge mit Kalibrierung, Bias-Prüfung und Gegenchecks
  • Halluzinationsmessung in RAG-Setups und Abgleich mit Referenzquellen
  • Metriken für Drift, Latency, Cost per Answer und Fehlerklassen
  • Entscheidungsgrundlagen für Modellfreigabe, Rollback und weitere Trainingsiteration

Deployment, Serving und Betrieb

  • Export von Adaptern, Adapter-Merge und Vorbereitung von Release-Artefakten
  • Quantisierung mit GPTQ oder AWQ für effiziente Inferenz
  • Serving mit vLLM und TGI inklusive Batching, KV-Cache und Streaming
  • Sicherheitsbetrachtung zu Prompt Injection, Data Exfiltration und Secrets
  • Modellkarten, Versionierung, Release-Prozess und Rollback-Strategien
  • Monitoring von Qualität, Kosten, Latenz und produktionsnahen Betriebsmetriken
Wer hier richtig ist
  • Softwareentwicklerinnen, Softwareentwickler und Machine-Learning-Engineers, die Open-Source LLMs für interne oder kundenspezifische Anwendungen anpassen
  • AI Engineers und Produktteams, die Qualität, Evaluation, Guardrails und Betrieb von LLM-basierten Features verantworten
  • Data Scientists mit Erfahrung in Python und Machine Learning, die SFT, LoRA, QLoRA und DPO in reproduzierbare Workflows überführen
  • Plattform-, MLOps- und DevOps-Teams, die Modell-Serving, Monitoring, Versionierung und sichere Releases vorbereiten
Das lernst du
  • Fundierte Entscheidung, ob Prompting, RAG, SFT, DPO oder ein kombinierter Ansatz für deinen Use Case geeignet ist
  • Instruction- und Preference-Datasets mit Quality Gates, Versionierung und klaren Labeling-Regeln aufbauen
  • Open-Source LLMs mit LoRA oder QLoRA trainieren und Trainingsläufe reproduzierbar dokumentieren
  • Evaluationen mit Golden Sets, Regression Tests und LLM-as-a-Judge methodisch belastbar planen
  • Fine-Tuning-Ergebnisse mit Quantisierung, vLLM oder TGI in einen stabilen Inferenzbetrieb überführen
  • Sicherheits- und Betriebsrisiken wie Prompt Injection, Datenabfluss, Drift und Rollback systematisch berücksichtigen
So arbeiten wir
  • Trainer-Input mit Live-Demos zu Modellwahl, Datendesign, SFT, DPO, Evaluation und Serving
  • Geführte Hands-on-Labs in bereitgestellten GPU-, VM- und Tool-Umgebungen
  • Praxisübungen mit Hugging Face Transformers, TRL, LoRA/QLoRA und DPO-Konfigurationen
  • Mini-Workshops zu Quality Gates, Golden Sets, Metriken und Release-Entscheidungen
  • Checklisten und Templates für Datensatz-Aufbau, Trainingsprotokolle, Modellkarten und Rollback
  • Gemeinsame Auswertung typischer Fehlerbilder aus Training, Evaluation und Inferenzbetrieb
Empfohlene Vorkenntnisse
  • Solide Python-Kenntnisse, idealerweise auf Niveau des Python Aufbaukurses
  • Erfahrung mit CLI, Git und reproduzierbaren Entwicklungsabläufen, beispielsweise aus Git, GitLab und CI/CD
  • Grundverständnis von Transformer-Modellen, Tokenisierung und ML-Training
  • Vertrautheit mit Begriffen wie Loss, Epoch, Overfitting, Checkpoint und Hyperparameter
Dein Fahrplan

Der erste Tag schafft die Grundlage für belastbare Fine-Tuning-Entscheidungen. Behandelt werden Use-Case-Scoping, Erfolgskriterien, Abgrenzung von Prompting, RAG, SFT und Full Fine-Tuning sowie die Auswahl geeigneter Base Models. Dazu kommen Lizenz- und Compliance-Aspekte, Compute-Planung, VRAM-Bedarf, Kostenabschätzung und PEFT-Strategien. Im Datenblock entstehen Instruction-Formate, Labeling-Guidelines, Quality Gates und Ansätze für Data Mixing, Deduplication, Leakage-Prüfung, PII-Kontrolle und Datensatz-Versionierung.

Organisatorisches

Lernformate

Unsere Seminare bieten dir maximale Flexibilität: Du kannst zwischen Live-Online und Vor Ort in unseren modernen Schulungszentren im D-A-CH Raum wählen. Beide Formate garantieren dir die gleiche hohe Qualität und interaktive Lernerfahrung.

Schulungsarten

Wir bieten dir verschiedene Schulungsarten: Offene Seminare, Firmenseminare für Teams und Inhouse-Schulungen direkt bei dir vor Ort. So findest du genau das Format, das zu deinen Bedürfnissen passt.

Uhrzeiten

9:00-16:00 Uhr

Aktuelle Software

In unseren offenen Kursen arbeiten wir mit der aktuellsten Software-Version. So lernst du direkt mit den Tools und Features, die du auch in deinem Arbeitsalltag verwendest - praxisnah und zukunftsorientiert. Bei Inhouse- und Firmenschulungen bestimmt ihr die Version.

Deine Vorteile

Zufriedenheitsgarantie

Wir sind von unserer Qualität überzeugt. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.

Inklusivleistungen

Deine Teilnahme beinhaltet: Schulungsmaterial, Zertifikat, Verpflegung (bei Präsenzveranstaltungen) und persönliche Betreuung durch unsere Trainer und unser Orga-Team. Alles aus einer Hand - keine versteckten Kosten.

Lernen von Experten

Unsere Trainer sind zertifizierte und erfahrene Profis mit jahrelanger Berufserfahrung. Sie vermitteln dir in den Kursen nicht nur theoretisches Wissen, sondern teilen ihre Erfahrungen aus realen Projekten und helfen dir, das Gelernte direkt in deiner täglichen Arbeit anzuwenden. Das ist kein Werbeversprechen, sondern unser Anspruch. Am besten siehst du das in unseren Bewertungen, z.B. auch bei Google.

Keine Vorkasse

Du zahlst erst nach dem Seminar. Keine Vorkasse, keine Vorauszahlung - so kannst du sicher sein, dass du nur für das bezahlst, was du auch wirklich erhalten hast. Die Rechnung erhältst du erst nach Kursbeginn.

Max. 8 Teilnehmende

Wir setzen auf kleine Gruppen, damit du die Aufmerksamkeit bekommst, die du verdienst. So haben wir mehr Zeit für deine individuellen Fragen und können gezielt auf deine Bedürfnisse eingehen.

Termine & Buchung

Vor Ort

Standardpreis: 1.490,00 € netto (1.773,10 € brutto)
14. - 16.09.2026
14. - 16.12.2026
15. - 17.02.2027
19. - 21.04.2027

Online

Standardpreis: 1.490,00 € netto (1.773,10 € brutto)
14. - 16.09.2026
14. - 16.12.2026
15. - 17.02.2027
19. - 21.04.2027

Nicht der passende Termin dabei?

Wir finden eine Lösung: anderer Termin, mehrere Teilnehmer, Inhouse-Schulung oder individuelle Beratung.

Anfrage stellen
Inhouse & Firmenseminare

Lieber gleich das ganze Team schulen?

Diese Schulung gibt es auch exklusiv für dein Unternehmen, bei euch vor Ort, an unseren Standorten oder Live-Online. Inhalte und Termine nach Maß.

Beliebteste Wahl

Inhouse-Schulung

Wir kommen zu euch: diese Schulung maßgeschneidert in euren Räumen, für Unternehmen und Behörden.

  • Inhalte exakt auf euch zugeschnitten
  • Termine nach euren Bedürfnissen
  • Günstiger ab mehreren Teilnehmern
  • Vertraute Umgebung, kein Reiseaufwand
Inhouse-Schulung anfragen

Firmen-Seminar

Exklusiv für dein Team an einem unserer Standorte oder Live-Online, individuell angepasst.

  • Geschlossene Gruppe aus eurem Haus
  • Individuelle Terminplanung
  • An unseren Standorten oder Live-Online
  • Angepasste Inhalte
Firmen-Seminar anfragen

Fragen und Antworten zu Open-Source LLM Fine-Tuning für Entwickler

Für wen eignet sich die Open-Source LLM Fine-Tuning Schulung?

Die Schulung richtet sich an Entwicklerinnen, Entwickler, Machine-Learning-Engineers, AI Engineers, Data Scientists und MLOps-Teams, die Open-Source LLMs nicht nur testen, sondern reproduzierbar an Domänen, Produkte oder interne Prozesse anpassen möchten. Besonders passend ist das Seminar, wenn du bereits erste LLM-Prototypen kennst und nun belastbare Trainings-, Evaluations- und Betriebsabläufe brauchst.

Welche Vorkenntnisse sind für LoRA, QLoRA und DPO notwendig?

Erforderlich sind solide Python-Kenntnisse, Erfahrung mit CLI und Git sowie ein Grundverständnis von Transformer-Modellen, Tokenisierung und ML-Training. Begriffe wie Loss, Epoch, Overfitting und Checkpoint sollten vertraut sein. Für die Vorbereitung eignen sich der Python Aufbaukurs und der Python Machine Learning Grundkurs.

Brauche ich eigene GPUs oder spezielle Lizenzen?

Nein. Falls für Übungen erforderlich, werden dir VMs, GPUs und die benötigte Software bereitgestellt. Du brauchst keine eigene GPU-Hardware, keine zusätzlichen Lizenzen und kein spezielles Notebook. Im Seminar wird außerdem besprochen, wie VRAM, Durchsatz, Trainingszeit und Kosten für eigene Fine-Tuning-Projekte realistisch eingeschätzt werden.

Welche Open-Source LLMs werden im Seminar behandelt?

Gearbeitet wird exemplarisch mit verbreiteten Open-Source LLM-Familien wie Llama, Mistral oder Qwen. Die konkrete Modellvariante richtet sich nach Verfügbarkeit, Übungsziel, Hardware-Anforderungen und Lizenzrahmen. Wichtiger als ein einzelnes Modell ist der übertragbare Workflow von Modellwahl, Datensatz-Aufbau, Training, Evaluation und Deployment.

Geht es in der Schulung auch um RAG?

RAG ist nicht der Hauptinhalt, wird aber an den relevanten Schnittstellen behandelt. Dazu gehören Use-Case-Abgrenzung, Datendesign, Halluzinationsmessung, Regression Tests, Guardrails und die Entscheidung, ob ein Problem besser über Retrieval, Fine-Tuning oder eine Kombination gelöst wird.

Was ist der Unterschied zwischen SFT und DPO?

Supervised Fine-Tuning trainiert ein Modell auf gewünschte Zielantworten und eignet sich besonders für Format, Tonalität, Domänenwissen und wiederkehrende Aufgabenmuster. Direct Preference Optimization nutzt bevorzugte und abgelehnte Antwortpaare, um das Antwortverhalten stärker an Qualitäts-, Sicherheits- oder Policy-Kriterien auszurichten. Im Seminar werden beide Verfahren praktisch eingeordnet und miteinander kombiniert.

Wie wird die Qualität eines feinabgestimmten LLM bewertet?

Die Bewertung erfolgt nicht nur über Einzelbeispiele. Du arbeitest mit Golden Sets, Task-Suites, Regression Tests, LLM-as-a-Judge mit Kalibrierung und Metriken für Halluzinationen, Latenz, Kosten und Drift. Ziel ist eine belastbare Entscheidungsgrundlage, ob ein Modell freigegeben, nachtrainiert oder zurückgerollt wird.

Ist das Seminar eher Forschung oder Produktentwicklung?

Der Schwerpunkt liegt auf Produktentwicklung und betrieblichen Abläufen. Du lernst Entscheidungsregeln, Quality Gates, Evaluation und Serving so einzusetzen, dass Fine-Tuning in Teams nachvollziehbar, wartbar und releasefähig bleibt. Forschungsdetails werden nur dort vertieft, wo sie für technische Entscheidungen im Projekt relevant sind.

Weitere häufig gestellte Fragen und Antworten findest du in den FAQs .

Unser Qualitätsversprechen: Wissen, das in der Praxis funktioniert

Aus der Praxis für die Praxis

Schluss mit theoretischem Ballast. Wir trainieren dich für reale IT-Herausforderungen, nicht für Multiple-Choice-Tests. Unsere Trainer vermitteln dir genau das Wissen, das am nächsten Montagmorgen im Job wirklich funktioniert.

Individuell statt "Schema F"

Deine Fragen passen nicht ins Standard-Skript? Bei uns schon. Wir verzichten auf starre Lehrpläne und geben deinen konkreten Projekt-Fragen Raum. Unsere Trainer passen die Inhalte flexibel an das an, was dich und dein Team aktuell weiterbringt.

Maximale Freiheit: Remote oder vor Ort

Lerne so, wie es in deinen Alltag passt - ohne Reise-Stress und Zeitverlust. Egal ob remote, hybrid oder präsent vor Ort: Wir garantieren dir ein nahtloses und effektives Lernerlebnis, egal von wo du dich zuschaltest.

Mit Zufriedenheitsgarantie

Wir sind von unserer Qualität überzeugt - und wollen, dass du es auch bist. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.

Über 20.000 Unternehmen und Behörden vertrauen auf uns

Alle Referenzen
Siemens Logo
Telekom Logo
Rheinmetall Logo
Infineon Logo
MAN Logo
Fraunhofer Logo
ADAC Logo
Munich Re Logo
Deutsche Bahn Logo
ab 1.490 €
zzgl. 19% MwSt.