Open-Source LLM Fine-Tuning für Entwickler

Domänenspezifische Open-Source LLMs mit LoRA, DPO, Evaluation und Serving sicher umsetzen

5,0 (2260 Bewertungen)

Die wichtigsten Themen

LoRA und QLoRA sicher einsetzen

SFT-Datasets versioniert aufbauen

DPO mit Preference-Daten anwenden

Evaluation mit Golden Sets planen

vLLM und TGI für Serving nutzen

Prompt-Injection-Risiken bewerten

4.9 von 5 Sternen 500+ Google Bewertungen

28 Jahre Erfahrung Zufriedenheit. Garantiert.

5.0 / 5 Sternen 2260 Gesamtbewertungen

Zahlreiche Termine Kontinuierlich geplant

Überblick In dieser Advanced-Schulung lernst du, Open-Source LLM Fine-Tuning strukturiert für reale Entwicklungs- und Produktumgebungen umzusetzen. Im Mittelpunkt stehen domänenspezifische Sprachmodelle, belastbare Datensätze,...

In dieser Advanced-Schulung lernst du, Open-Source LLM Fine-Tuning strukturiert für reale Entwicklungs- und Produktumgebungen umzusetzen. Im Mittelpunkt stehen domänenspezifische Sprachmodelle, belastbare Datensätze, reproduzierbare Trainingsläufe und der stabile Betrieb nach dem Training. Statt Modelle per Trial-and-Error anzupassen, arbeitest du mit klaren Entscheidungsregeln: Wann reicht Prompting, wann ist RAG sinnvoller, wann lohnt sich SFT mit LoRA oder QLoRA und wann bringt Preference Tuning mit DPO einen messbaren Qualitätsgewinn?

Das Seminar führt dich von der Modell- und Trainingsstrategie über Instruction-Datasets, Quality Gates, Hugging Face Transformers und TRL bis zu Evaluation, Quantisierung und Serving mit vLLM oder TGI. Dabei bleiben Betriebsfragen wie Versionierung, Rollback, Prompt-Injection-Risiken, Data Exfiltration und Monitoring durchgehend Teil des Workflows. Wenn du deine Grundlagen vorher festigen möchtest, passen der Python Aufbaukurs, der Python Machine Learning Grundkurs oder das Seminar Transfer Learning als Vorbereitung. Für den produktiven Betrieb von KI-Anwendungen ergänzt KI-Apps containerisieren mit Podman, Docker & Kubernetes die Deployment-Perspektive.

Die Themen Use-Case-Scoping für Chat, RAG, Tool-Use und Klassifikation · Abgrenzung von Prompting, RAG, SFT, Preference Tuning und Full Fine-Tuning · Auswahl geeigneter Base Models wie Llama, Mistral oder Qwen...

Modell- und Trainingsstrategie

Use-Case-Scoping für Chat, RAG, Tool-Use und Klassifikation
Abgrenzung von Prompting, RAG, SFT, Preference Tuning und Full Fine-Tuning
Auswahl geeigneter Base Models wie Llama, Mistral oder Qwen
Lizenz-, Compliance- und Deployment-Aspekte bei Open-Source LLMs
Compute-Kalkulation für VRAM, Durchsatz, Trainingsdauer und Kosten
Entscheidungskriterien für PEFT, LoRA, QLoRA und vollständiges Fine-Tuning

Datendesign und Qualitätssicherung

Aufbau von Instruction-Datasets mit Rollen, Systemregeln und Prompt-Formaten
Definition von Zielverhalten, Ablehnungslogik und Policy-Style für Modellantworten
Deduplication, Leakage-Prüfung, Toxicity-Checks und Umgang mit PII
Labeling-Guidelines, Review-Prozesse und Inter-Annotator-Checks
Data Mixing aus Domain-Daten, General-Daten, Safety-Beispielen und Hard Negatives
Datensatz-Versionierung, Quality Gates und reproduzierbare Trainingsstände

Supervised Fine-Tuning mit PEFT

LoRA- und QLoRA-Konzepte mit Rank, Alpha, Target Modules und Adapter-Struktur
Tokenisierung, Chat Templates, Packing, Sequence Length und Loss Masking
Training mit Hugging Face Transformers, TRL und typischen SFT-Konfigurationen
Hyperparameter-Entscheidungen für Learning Rate, Batch Size und Gradient Accumulation
Stabilisierung von Trainingsläufen mit Checkpoints, Seeds und Run-Protokollen
Analyse von Trainingssignalen, Overfitting-Risiken und Regressionsmustern

Preference Tuning mit DPO

Aufbau von Pairwise-Preference-Daten mit Chosen- und Rejected-Antworten
DPO-Grundidee, Beta-Konfiguration und typische Fehlerquellen
Sampling-Strategien für Präferenzdaten und Umgang mit widersprüchlichen Labels
Vergleich von DPO mit Alternativen wie ORPO, IPO und Best-of-N Sampling
Guardrails für Ablehnungen, Safety-Prompts und policy-konformes Antwortverhalten
Bewertung von Preference-Tuning-Ergebnissen jenseits subjektiver Einzelbeispiele

Evaluation und Regression Tests

Offline-Evaluation mit Task-Suites, Golden Sets und domänenspezifischen Testfällen
Regression Tests für Antwortqualität, Formatstabilität, Sicherheitsverhalten und Tool-Use
LLM-as-a-Judge mit Kalibrierung, Bias-Prüfung und Gegenchecks
Halluzinationsmessung in RAG-Setups und Abgleich mit Referenzquellen
Metriken für Drift, Latency, Cost per Answer und Fehlerklassen
Entscheidungsgrundlagen für Modellfreigabe, Rollback und weitere Trainingsiteration

Deployment, Serving und Betrieb

Export von Adaptern, Adapter-Merge und Vorbereitung von Release-Artefakten
Quantisierung mit GPTQ oder AWQ für effiziente Inferenz
Serving mit vLLM und TGI inklusive Batching, KV-Cache und Streaming
Sicherheitsbetrachtung zu Prompt Injection, Data Exfiltration und Secrets
Modellkarten, Versionierung, Release-Prozess und Rollback-Strategien
Monitoring von Qualität, Kosten, Latenz und produktionsnahen Betriebsmetriken

Zielgruppe

Softwareentwicklerinnen, Softwareentwickler und Machine-Learning-Engineers, die Open-Source LLMs für interne oder kundenspezifische Anwendungen anpassen
AI Engineers und Produktteams, die Qualität, Evaluation, Guardrails und Betrieb von LLM-basierten Features verantworten
Data Scientists mit Erfahrung in Python und Machine Learning, die SFT, LoRA, QLoRA und DPO in reproduzierbare Workflows überführen
Plattform-, MLOps- und DevOps-Teams, die Modell-Serving, Monitoring, Versionierung und sichere Releases vorbereiten

Das lernst du

Fundierte Entscheidung, ob Prompting, RAG, SFT, DPO oder ein kombinierter Ansatz für deinen Use Case geeignet ist
Instruction- und Preference-Datasets mit Quality Gates, Versionierung und klaren Labeling-Regeln aufbauen
Open-Source LLMs mit LoRA oder QLoRA trainieren und Trainingsläufe reproduzierbar dokumentieren
Evaluationen mit Golden Sets, Regression Tests und LLM-as-a-Judge methodisch belastbar planen
Fine-Tuning-Ergebnisse mit Quantisierung, vLLM oder TGI in einen stabilen Inferenzbetrieb überführen
Sicherheits- und Betriebsrisiken wie Prompt Injection, Datenabfluss, Drift und Rollback systematisch berücksichtigen

So arbeiten wir

Trainer-Input mit Live-Demos zu Modellwahl, Datendesign, SFT, DPO, Evaluation und Serving
Geführte Hands-on-Labs in bereitgestellten GPU-, VM- und Tool-Umgebungen
Praxisübungen mit Hugging Face Transformers, TRL, LoRA/QLoRA und DPO-Konfigurationen
Mini-Workshops zu Quality Gates, Golden Sets, Metriken und Release-Entscheidungen
Checklisten und Templates für Datensatz-Aufbau, Trainingsprotokolle, Modellkarten und Rollback
Gemeinsame Auswertung typischer Fehlerbilder aus Training, Evaluation und Inferenzbetrieb

Empfohlene Vorkenntnisse

Solide Python-Kenntnisse, idealerweise auf Niveau des Python Aufbaukurses
Erfahrung mit CLI, Git und reproduzierbaren Entwicklungsabläufen, beispielsweise aus Git, GitLab und CI/CD
Grundverständnis von Transformer-Modellen, Tokenisierung und ML-Training
Vertrautheit mit Begriffen wie Loss, Epoch, Overfitting, Checkpoint und Hyperparameter

Dein Fahrplan

Der erste Tag schafft die Grundlage für belastbare Fine-Tuning-Entscheidungen. Behandelt werden Use-Case-Scoping, Erfolgskriterien, Abgrenzung von Prompting, RAG, SFT und Full Fine-Tuning sowie die Auswahl geeigneter Base Models. Dazu kommen Lizenz- und Compliance-Aspekte, Compute-Planung, VRAM-Bedarf, Kostenabschätzung und PEFT-Strategien. Im Datenblock entstehen Instruction-Formate, Labeling-Guidelines, Quality Gates und Ansätze für Data Mixing, Deduplication, Leakage-Prüfung, PII-Kontrolle und Datensatz-Versionierung.

Organisatorisches

Lernformate

Unsere Seminare bieten dir maximale Flexibilität: Du kannst zwischen Live-Online und Vor Ort in unseren modernen Schulungszentren im D-A-CH Raum wählen. Beide Formate garantieren dir die gleiche hohe Qualität und interaktive Lernerfahrung.

Schulungsarten

Wir bieten dir verschiedene Schulungsarten: Offene Seminare, Firmenseminare für Teams und Inhouse-Schulungen direkt bei dir vor Ort. So findest du genau das Format, das zu deinen Bedürfnissen passt.

Uhrzeiten

09:00-16:00 Uhr

Aktuelle Software

In unseren offenen Kursen arbeiten wir mit der aktuellsten Software-Version. So lernst du direkt mit den Tools und Features, die du auch in deinem Arbeitsalltag verwendest - praxisnah und zukunftsorientiert. Bei Inhouse- und Firmenschulungen bestimmt ihr die Version.

Deine Vorteile

Zufriedenheitsgarantie

Wir sind von unserer Qualität überzeugt. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.

Inklusivleistungen

Deine Teilnahme beinhaltet: Schulungsmaterial, Zertifikat, Verpflegung (bei Präsenzveranstaltungen) und persönliche Betreuung durch unsere Trainer und unser Orga-Team. Alles aus einer Hand - keine versteckten Kosten.

Lernen von Experten

Unsere Trainer sind zertifizierte und erfahrene Profis mit jahrelanger Berufserfahrung. Sie vermitteln dir in den Kursen nicht nur theoretisches Wissen, sondern teilen ihre Erfahrungen aus realen Projekten und helfen dir, das Gelernte direkt in deiner täglichen Arbeit anzuwenden. Das ist kein Werbeversprechen, sondern unser Anspruch. Am besten siehst du das in unseren Bewertungen, z.B. auch bei Google.

Keine Vorkasse

Du zahlst erst nach dem Seminar. Keine Vorkasse, keine Vorauszahlung - so kannst du sicher sein, dass du nur für das bezahlst, was du auch wirklich erhalten hast. Die Rechnung erhältst du erst nach Kursbeginn.

Max. 8 Teilnehmende

Wir setzen auf kleine Gruppen, damit du die Aufmerksamkeit bekommst, die du verdienst. So haben wir mehr Zeit für deine individuellen Fragen und können gezielt auf deine Bedürfnisse eingehen.

Termine & Buchung

Vor Ort

Standardpreis: 1.490,00 € netto (1.773,10 € brutto)

30.09. - 02.10.2026

München

Anfragen Buchen

14. - 16.12.2026

München

Anfragen Buchen

15. - 17.02.2027

München

Anfragen Buchen

19. - 21.04.2027

München

Anfragen Buchen

07. - 09.06.2027

München

Anfragen Buchen

Online

Standardpreis: 1.490,00 € netto (1.773,10 € brutto)

30.09. - 02.10.2026

14. - 16.12.2026

15. - 17.02.2027

19. - 21.04.2027

07. - 09.06.2027

Nicht der passende Termin dabei?

Wir finden eine Lösung: anderer Termin, mehrere Teilnehmer, Inhouse-Schulung oder individuelle Beratung.

Anfrage stellen

Inhouse & Firmenseminare

Lieber gleich das ganze Team schulen?

Diese Schulung gibt es auch exklusiv für dein Unternehmen, bei euch vor Ort, an unseren Standorten oder Live-Online. Inhalte und Termine nach Maß.

Beliebteste Wahl

Inhouse-Schulung

Wir kommen zu euch: diese Schulung maßgeschneidert in euren Räumen, für Unternehmen und Behörden.

Inhalte exakt auf euch zugeschnitten
Termine nach euren Bedürfnissen
Günstiger ab mehreren Teilnehmern
Vertraute Umgebung, kein Reiseaufwand

Inhouse-Schulung anfragen

Firmen-Seminar

Exklusiv für dein Team an einem unserer Standorte oder Live-Online, individuell angepasst.

Geschlossene Gruppe aus eurem Haus
Individuelle Terminplanung
An unseren Standorten oder Live-Online
Angepasste Inhalte

Firmen-Seminar anfragen

Offenes Seminar

Fester Termin aus unserem Programm, an unseren Standorten oder Live-Online und für alle offen.

Feste Termine, im Voraus planbar
An unseren Standorten oder Live-Online
Austausch mit anderen Unternehmen
Direkte Buchung mit festem Termin

Termine ansehen

Fragen und Antworten zu Open-Source LLM Fine-Tuning für Entwickler

Für wen eignet sich die Open-Source LLM Fine-Tuning Schulung?

Die Schulung richtet sich an Entwicklerinnen, Entwickler, Machine-Learning-Engineers, AI Engineers, Data Scientists und MLOps-Teams, die Open-Source LLMs nicht nur testen, sondern reproduzierbar an Domänen, Produkte oder interne Prozesse anpassen möchten. Besonders passend ist das Seminar, wenn du bereits erste LLM-Prototypen kennst und nun belastbare Trainings-, Evaluations- und Betriebsabläufe brauchst.

Welche Vorkenntnisse sind für LoRA, QLoRA und DPO notwendig?

Erforderlich sind solide Python-Kenntnisse, Erfahrung mit CLI und Git sowie ein Grundverständnis von Transformer-Modellen, Tokenisierung und ML-Training. Begriffe wie Loss, Epoch, Overfitting und Checkpoint sollten vertraut sein. Für die Vorbereitung eignen sich der Python Aufbaukurs und der Python Machine Learning Grundkurs.

Brauche ich eigene GPUs oder spezielle Lizenzen?

Nein. Falls für Übungen erforderlich, werden dir VMs, GPUs und die benötigte Software bereitgestellt. Du brauchst keine eigene GPU-Hardware, keine zusätzlichen Lizenzen und kein spezielles Notebook. Im Seminar wird außerdem besprochen, wie VRAM, Durchsatz, Trainingszeit und Kosten für eigene Fine-Tuning-Projekte realistisch eingeschätzt werden.

Welche Open-Source LLMs werden im Seminar behandelt?

Gearbeitet wird exemplarisch mit verbreiteten Open-Source LLM-Familien wie Llama, Mistral oder Qwen. Die konkrete Modellvariante richtet sich nach Verfügbarkeit, Übungsziel, Hardware-Anforderungen und Lizenzrahmen. Wichtiger als ein einzelnes Modell ist der übertragbare Workflow von Modellwahl, Datensatz-Aufbau, Training, Evaluation und Deployment.

Geht es in der Schulung auch um RAG?

RAG ist nicht der Hauptinhalt, wird aber an den relevanten Schnittstellen behandelt. Dazu gehören Use-Case-Abgrenzung, Datendesign, Halluzinationsmessung, Regression Tests, Guardrails und die Entscheidung, ob ein Problem besser über Retrieval, Fine-Tuning oder eine Kombination gelöst wird.

Was ist der Unterschied zwischen SFT und DPO?

Supervised Fine-Tuning trainiert ein Modell auf gewünschte Zielantworten und eignet sich besonders für Format, Tonalität, Domänenwissen und wiederkehrende Aufgabenmuster. Direct Preference Optimization nutzt bevorzugte und abgelehnte Antwortpaare, um das Antwortverhalten stärker an Qualitäts-, Sicherheits- oder Policy-Kriterien auszurichten. Im Seminar werden beide Verfahren praktisch eingeordnet und miteinander kombiniert.

Wie wird die Qualität eines feinabgestimmten LLM bewertet?

Die Bewertung erfolgt nicht nur über Einzelbeispiele. Du arbeitest mit Golden Sets, Task-Suites, Regression Tests, LLM-as-a-Judge mit Kalibrierung und Metriken für Halluzinationen, Latenz, Kosten und Drift. Ziel ist eine belastbare Entscheidungsgrundlage, ob ein Modell freigegeben, nachtrainiert oder zurückgerollt wird.

Ist das Seminar eher Forschung oder Produktentwicklung?

Der Schwerpunkt liegt auf Produktentwicklung und betrieblichen Abläufen. Du lernst Entscheidungsregeln, Quality Gates, Evaluation und Serving so einzusetzen, dass Fine-Tuning in Teams nachvollziehbar, wartbar und releasefähig bleibt. Forschungsdetails werden nur dort vertieft, wo sie für technische Entscheidungen im Projekt relevant sind.

Weitere häufig gestellte Fragen und Antworten findest du in den FAQs.

Unser Qualitätsversprechen: Wissen, das in der Praxis funktioniert

Aus der Praxis für die Praxis

Schluss mit theoretischem Ballast. Wir trainieren dich für reale IT-Herausforderungen, nicht für Multiple-Choice-Tests. Unsere Trainer vermitteln dir genau das Wissen, das am nächsten Montagmorgen im Job wirklich funktioniert.

Individuell statt "Schema F"

Deine Fragen passen nicht ins Standard-Skript? Bei uns schon. Wir verzichten auf starre Lehrpläne und geben deinen konkreten Projekt-Fragen Raum. Unsere Trainer passen die Inhalte flexibel an das an, was dich und dein Team aktuell weiterbringt.

Maximale Freiheit: Remote oder vor Ort

Lerne so, wie es in deinen Alltag passt - ohne Reise-Stress und Zeitverlust. Egal ob remote, hybrid oder präsent vor Ort: Wir garantieren dir ein nahtloses und effektives Lernerlebnis, egal von wo du dich zuschaltest.

Mit Zufriedenheitsgarantie

Wir sind von unserer Qualität überzeugt - und wollen, dass du es auch bist. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.

Über 20.000 Unternehmen und Behörden vertrauen auf uns

Alle Referenzen

Präsenz:

30.09. - 02.10.2026 in München

Online:

30.09. - 02.10.2026

ab 1.490 €

zzgl. 19% MwSt.

Termine ansehen Inhouse Firmenseminar

Open-Source LLM Fine-Tuning für Entwickler

Domänenspezifische Open-Source LLMs mit LoRA, DPO, Evaluation und Serving sicher umsetzen