EN

Modul

Verteiltes Rechnen [M-INFO-100761]

Leistungspunkte
4
Turnus
Jedes Wintersemester
Dauer
1 Semester
Sprache
Englisch
Level
4
Version
1

Verantwortung

Einrichtung

  • KIT-Fakultät für Informatik

Bestandteil von

Teilleistungen

Identifier Name LP
T-INFO-101298 Verteiltes Rechnen 4

Erfolgskontrolle(n)

Siehe Teilleistung

Qualifikationsziele

Studierende verstehen die Grundbegriffe verteilter Systeme, im Speziellen in den aktuellen Techniken des Grid und Cloud Computing sowie des Management großer bzw. verteilter Daten. Sie wenden zugrundeliegenden Paradigmen und Services auf gegebene Beispiel an.

Studierende analysieren Methoden und Technologien des Grid und Cloud Computing sowie verteilten Daten-Managements, die für den Einsatz in alltags- und industriellen Anwendungsgebieten geeignet sind bzw. welche heute von Google, Facebook, Amazon, etc. eingesetzt werden. Hierfür vergleichen die Studierenden Web/Grid Services, elementare Grid Funktionalitäten, Datenlebenszyklen, Metadaten, Archivierung, Cloud Service Typen (IaaS, SaaS, PaaS) und Public/Private Clouds anhand von Beispielen aus der Praxis.

Voraussetzungen

Siehe Teilleistung

Inhalt

ie Vorlesung „Verteiltes Rechnen“ gibt eine Einführung in die Welt des verteilten Rechnens mit einem Fokus auf Grundlagen, Technologien und Beispielen aus Grid, Cloud und dem Umgang mit Big Data.

Zuerst wird eine Einführung in die Hauptcharakteristika verteilter Systeme gegeben. Danach wird auf die Thematik Grid näher eingegangen und es werden Architektur, Grid Services, Sicherheit und Job Ausführung vorgestellt. Am Beispiel des WLCG (der Grid Infrastruktur zur Verteilung, Speicherung und Analyse der Daten des LHC-Beschleunigers am CERN) wird die enge Verwandtschaft zwischen Grid Computing und verteiltem Daten-Management dargestellt.

Im zweiten Teil werden Prinzipien und Werkzeuge zum Management großer bzw. verteilter Daten vorgestellt - dies schließt Datenlebenszyklus, Metadaten und Archivierung ein. Beispiele aus Wissenschaft und Industrie dienen zur Veranschaulichung. Moderne Speichersysteme wie z.B. dCache, xrootd, Ceph und HadoopFS werden als praktische Beispiele vorgestellt.

Der dritte Teil der Vorlesung geht auf das Thema Cloud ein. Nach der Definition grundlegender Begriffe und Prinzipien (Iaas, PaaS, SaaS, public vs. private Clouds), auch mittels Beispielen, wird das Thema Virtualisierung als grundlegende Technik des Cloud Computing vorgestellt. Den Abschluss bildet MapReduce als Mechanismus zur Verarbeitung und Analyse großer, verteilter Datenbestände wie es auch von Google eingesetzt wird.

Arbeitsaufwand

120 h / Semester, davon 30 h Präsenzzeit und 90 h Selbstlernen aufgrund der Komplexität des Stoffs