EN

Modul

Praktikum: Advanced Topics in High Performance Computing, Data Management and Analytics [M-INFO-105870]

Leistungspunkte
6
Turnus
Jedes Semester
Dauer
1 Semester
Sprache
Englisch
Level
4
Version
1

Verantwortung

Einrichtung

  • KIT-Fakultät für Informatik

Bestandteil von

Teilleistungen

Identifier Name LP
T-INFO-111803 Praktikum: Advanced Topics in High Performance Computing, Data Management and Analytics 6

Erfolgskontrolle(n)

Siehe Teilleistung.

Qualifikationsziele

Studierende sind in der Lage, die in den Vorlesungen erworbene fachlichen Kompetenzen auf praxisnahe Problemstellungen aus den Bereichen Datenmanagement und Datenanalyse zu übertragen und anzuwenden. Neben der Bewältigung der individuellen Praktikumsaufgaben, steht die Stärkung der Kommunikationskompetenz und die Analyse systemische Betrachtung komplexer Sachverhalte im Fokus des Praktikums.

Voraussetzungen

Siehe Teilleistung.

Inhalt

Die Praktikumsteilnehmer erhalten die Möglichkeit, Ihre Kenntnisse aus dem Bereichen Datenmanagement und Datenanalyse zu vertiefen und praxisnah einzusetzen. Die zu bearbeitenden Aufgaben stammen aus den Teilgebieten:

  • HPC Simulationen (z.B. Parallelisierung, MPI, Performance Engineering, etc.)
  • HPC Systeme und Betriebsumgebung (z.B. On Demand File Systems, Infiniband-Netzwerke, Job-Scheduling)
  • Maschinelles Lernen und Data Mining (z.B. RapidMiner, scikit)
  • Daten-Intensives Rechnen (z.B. Hadoop, Spark)
  • HPC und Datenanalyse mit Python (Numpy, Scipy, Pandas, Dask, Parsl)
  • Verteilte & Parallele Dateisysteme (z.B. glusterFS, BeeGFS)
  • Object Storage (z.B. S3, CEPH)
  • Datenmanagement System (z.B. dCache, iRods)
  • Datenbanken (SQL, NoSQL)
  • Workflowmanagementsysteme für HPC und Datenanalyse (FireWorks, AiiDA, SimStack)
  • Opportunistische Ressourceneinbindung und -nutzung (z.B. mittels COBalD/TARDIS)
  • Authentifizierungs- und Autorisierungs-Infrastruktur (z.B. OpenID, SAML)

Die Studierenden werden durch wissenschaftliche Mitarbeitende des Scientific Centre for Computing (SCC) individuell betreut und können ihre Fähigkeiten durch Einbindung in aktuelle Forschungsaufgaben (z.B. Helmholtz-Programm, BMBF- und EU-Projekte) praxis- und forschungsnah einsetzen.

Themenvergabe und Planung der Präsenztermine erfolgt individuell zw. Praktikumsteilnehmer und Betreuer. Praktikumsteilnehmer bearbeiten separate Aufgabengebiete. Bei der Erstellung der Aufgabe werden eventuelle Vorkenntnisse und Interessensgebiete der Teilnehmer berücksichtigt.

Empfehlungen

Grundkenntnisse in den Bereichen Datenbanken, Datenmanagement, Datenanalyse, Parallelrechner oder Parallelprogrammierung sind hilfreich.

Arbeitsaufwand

3 SWS, 150 h/Semester

  • 12 h Präsenzzeit in Praktikumsbesprechungen (Kick-Off, regelmäßige Betreuungstreffen, Abschlussveranstaltung
  • 18 h Vor-/Nachbereitung der Praktikumsbesprechungen
  • 120 h Bearbeitung des Themas und Erstellen der Prüfungsleistung