Building Batch Data Analytics Solutions on AWS
Amazon Web Services

Building Batch Data Analytics Solutions on AWS

1 Tag
Advanced
Überblick

In dieser praxisorientierten Schulung lernen Sie, wie Sie Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Service für Apache Spark und Apache Hadoop, erstellen. Der Kurs führt Sie in die Arbeit mit Open-Source-Technologien wie Apache Hive, Hue und HBase sowie in AWS-Dienste wie AWS Glue und AWS Lake Formation ein. Sie werden die gesamte Pipeline durchlaufen: von der Datensammlung und -aufnahme über die Katalogisierung und Speicherung bis hin zur Verarbeitung im Kontext von Spark und Hadoop.

Ein Schwerpunkt liegt auf Best Practices für Sicherheit, Performance und Kostenmanagement beim Einsatz von Amazon EMR. Sie lernen, wie Sie eine Batch-Datenanalyse-Lösung entwerfen und implementieren, Techniken zur Optimierung der Datenspeicherung anwenden und die besten Optionen für die Datenaufnahme, -umwandlung und -speicherung auswählen. Der Kurs behandelt zudem die Auswahl der richtigen Instanztypen und Cluster-Konfigurationen sowie die effiziente Netzwerktopologie und automatische Skalierung.

Ein weiteres Ziel des Kurses ist es, Ihnen die Grundlagen des Monitorings und der Fehlerbehebung von analytischen Workloads zu vermitteln, sodass Sie Engpässe erkennen und beheben können. Sie erfahren außerdem, wie Sie den sicheren Umgang mit Daten gewährleisten, sowohl im Ruhezustand als auch während der Übertragung.

Lernmethodik: Die Schulung kombiniert Theorie mit praktischen Übungen. Sie profitieren vom direkten Austausch mit unseren erfahrenen Trainern und anderen Teilnehmern, um Ihr Wissen effektiv zu erweitern.

Prüfung und Zertifizierung: Dieser Kurs bereitet Sie auf die Zertifizierungsprüfung AWS Certified Data Analytics - Specialty (DAS-C01) vor. Nach erfolgreichem Abschluss erhalten Sie die Zertifizierung AWS Certified Data Analytics - Specialty (CDAS). Die Prüfung kann sowohl in einem Prüfungsinstitut als auch bequem online abgelegt werden. Wir bieten Ihnen die Möglichkeit, den Prüfungs-Voucher zu erwerben.

Dieser Kurs wird mit den offiziellen AWS-Unterlagen und der AWS-Systemumgebung durchgeführt.

Wer hier richtig ist
  • Datenplattform-Ingenieure
  • Entwickler und Betreiber, die Datenanalyse-Pipelines erstellen und verwalten
Die Themen Einsatzmöglichkeiten der Datenanalyse · Einführung in die Datenpipeline für Analysezwecke · Nutzung von Amazon EMR für analytische Lösungen · Architektur von Amazon EMR-Clustern...

Überblick über Datenanalyse und die Data Pipeline

  • Einsatzmöglichkeiten der Datenanalyse
  • Einführung in die Datenpipeline für Analysezwecke

Einführung in Amazon EMR

  • Nutzung von Amazon EMR für analytische Lösungen
  • Architektur von Amazon EMR-Clustern
  • Interaktive Demo: Starten eines Amazon EMR-Clusters
  • Strategien zur Kostenoptimierung

Datenanalyse-Pipeline mit Amazon EMR: Datenaufnahme und Speicherung

  • Optimierung der Datenspeicherung in Amazon EMR
  • Methoden zur Datenaufnahme

High-Performance-Batch-Datenanalyse mit Apache Spark auf Amazon EMR

  • Einsatzmöglichkeiten von Apache Spark auf Amazon EMR
  • Spark-Konzepte: Transformation und Verarbeitung
  • Verwendung von Notebooks in Amazon EMR für Datenanalysen
  • Minimierung der Latenz bei Datenanalysen mit Spark

Batch-Datenverarbeitung mit Amazon EMR und Apache Hive

  • Nutzung von Amazon EMR und Hive für Batch-Datenverarbeitung
  • Einführung in Apache HBase auf Amazon EMR

Serverlose Datenverarbeitung

  • Einführung in serverlose Datenverarbeitung und -analyse
  • Nutzung von AWS Glue in Kombination mit Amazon EMR
  • Orchestrierung von Datenprozessen in Spark mit AWS Step Functions

Sicherheit und Monitoring von Amazon EMR-Clustern

  • Sicherung von EMR-Clustern
  • Verschlüsselung mit EMRFS
  • Monitoring und Fehlerbehebung von Amazon EMR-Clustern
  • Analyse des Verlaufs von Apache Spark-Clustern

Entwurf von Batch-Datenanalyselösungen

  • Anwendungsfälle der Batch-Datenanalyse
  • Entwurf von Workflows für die Batch-Datenanalyse

Entwicklung moderner Datenarchitekturen auf AWS

  • Überblick über moderne Datenarchitekturen
Empfohlene Vorkenntnisse
  • Mindestens ein Jahr Erfahrung in der Verwaltung von Open-Source-Data-Frameworks wie Apache Spark oder Apache Hadoop
Organisatorisches

Lernformate

Unsere Seminare bieten dir maximale Flexibilität: Du kannst zwischen Live-Online und Vor Ort in unseren modernen Schulungszentren im D-A-CH Raum wählen. Beide Formate garantieren dir die gleiche hohe Qualität und interaktive Lernerfahrung.

Schulungsarten

Wir bieten dir verschiedene Schulungsarten: Offene Seminare, Firmenseminare für Teams und Inhouse-Schulungen direkt bei dir vor Ort. So findest du genau das Format, das zu deinen Bedürfnissen passt.

Uhrzeiten

09:00–17:00 Uhr

Aktuelle Software

In unseren offenen Kursen arbeiten wir mit der aktuellsten Software-Version. So lernst du direkt mit den Tools und Features, die du auch in deinem Arbeitsalltag verwendest – praxisnah und zukunftsorientiert. Bei Inhouse- und Firmenschulungen bestimmt ihr die Version.

Deine Vorteile

Zufriedenheitsgarantie

Wir sind von unserer Qualität überzeugt. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.

Inklusivleistungen

Deine Teilnahme beinhaltet: Schulungsmaterial, Zertifikat, Verpflegung (bei Präsenzveranstaltungen) und persönliche Betreuung durch unsere Trainer und unser Orga-Team. Alles aus einer Hand – keine versteckten Kosten.

Lernen von Experten

Unsere Trainer sind zertifizierte und erfahrene Profis mit jahrelanger Berufserfahrung. Sie vermitteln dir in den Kursen nicht nur theoretisches Wissen, sondern teilen ihre Erfahrungen aus realen Projekten und helfen dir, das Gelernte direkt in deiner täglichen Arbeit anzuwenden. Das ist kein Werbeversprechen, sondern unser Anspruch. Am besten siehst du das in unseren Bewertungen, z.B. auch bei Google.

Keine Vorkasse

Du zahlst erst nach dem Seminar. Keine Vorkasse, keine Vorauszahlung – so kannst du sicher sein, dass du nur für das bezahlst, was du auch wirklich erhalten hast. Die Rechnung erhälst du erst nach Kursbeginn.

Max. 8 Teilnehmende

Wir setzen auf kleine Gruppen, damit jeder Teilnehmer die Aufmerksamkeit bekommt, die er verdient. So haben wir mehr Zeit für deine individuellen Fragen und können gezielt auf deine Bedürfnisse eingehen.

Termine & Buchung

Vor Ort

Standardpreis: 795,00 € netto (946,05 € brutto)
28.04.2026
25.06.2026
18.09.2026

Online

Standardpreis: 795,00 € netto (946,05 € brutto)
28.04.2026
25.06.2026
18.09.2026

Der passende Termin ist nicht dabei? Kontaktiere uns – wir finden die passende Lösung

Inhouse-Schulungen & Firmenseminare

Inhouse-Schulungen

Buche diese Schulung als maßgeschneiderte Inhouse-Schulung für dein Unternehmen oder deine Behörde. Unsere Trainer kommen zu dir und führen die Schulung in deinen Räumlichkeiten durch.

Vorteile:

  • Maßgeschneiderte Inhalte für dein Unternehmen
  • Flexible Terminplanung nach euren Bedürfnissen
  • Kosteneffizient bei mehreren Teilnehmern
  • Schulung in vertrauter Umgebung
  • Fokus auf deine spezifischen Anforderungen

Firmen-Seminare

Firmen-Seminare finden an einem unserer Schulungsstandorte statt, sind aber maßgeschneidert für dich und exklusiv für dein Team. Sie können auch online stattfinden.

Ideal für:

  • Geschlossene Gruppen aus einem Unternehmen / Behörde
  • Individuelle Terminplanung für dein Team
  • An unseren Schulungsstandorten oder Online
  • Angepasste Inhalte für deine Anforderungen

Unser Qualitätsversprechen: Wissen, das in der Praxis funktioniert

Aus der Praxis für die Praxis

Schluss mit theoretischem Ballast. Wir trainieren dich für reale IT-Herausforderungen, nicht für Multiple-Choice-Tests. Unsere Trainer vermitteln dir genau das Wissen, das am nächsten Montagmorgen im Job wirklich funktioniert.

Individuell statt "Schema F"

Deine Fragen passen nicht ins Standard-Skript? Bei uns schon. Wir verzichten auf starre Lehrpläne und geben deinen konkreten Projekt-Fragen Raum. Unsere Trainer passen die Inhalte flexibel an das an, was dich und dein Team aktuell weiterbringt.

Maximale Freiheit: Remote oder vor Ort

Lerne so, wie es in deinen Alltag passt – ohne Reise-Stress und Zeitverlust. Egal ob remote, hybrid oder präsent vor Ort: Wir garantieren dir ein nahtloses und effektives Lernerlebnis, egal von wo du dich zuschaltest.

Mit Zufriedenheitsgarantie

Wir sind von unserer Qualität überzeugt – und wollen, dass du es auch bist. Sollte ein Training einmal nicht deinen Erwartungen entsprechen, bieten wir dir an, den Kurs kostenlos zu wiederholen oder ein anderes Training zu besuchen. Ohne Risiko, ohne Diskussion.

Über 20.000 Unternehmen und Behörden vertrauen auf uns

Alle Referenzen
Siemens Logo
Telekom Logo
Rheinmetall Logo
Infineon Logo
MAN Logo
Fraunhofer Logo
ADAC Logo
Munich Re Logo
Deutsche Bahn Logo
ab 795 €
zzgl. 19% MwSt.