Modul
Praktikum: Advanced Topics in High Performance Computing, Data Management and Analytics [M-INFO-105870]
Leistungspunkte
6Turnus
Jedes SemesterDauer
1 SemesterSprache
EnglischLevel
4Version
1Verantwortung
Einrichtung
- KIT-Fakultät für Informatik
Bestandteil von
Teilleistungen
Identifier | Name | LP |
---|---|---|
T-INFO-111803 | Praktikum: Advanced Topics in High Performance Computing, Data Management and Analytics | 6 |
Erfolgskontrolle(n)
Siehe Teilleistung.
Qualifikationsziele
Studierende sind in der Lage, die in den Vorlesungen erworbene fachlichen Kompetenzen auf praxisnahe Problemstellungen aus den Bereichen Datenmanagement und Datenanalyse zu übertragen und anzuwenden. Neben der Bewältigung der individuellen Praktikumsaufgaben, steht die Stärkung der Kommunikationskompetenz und die Analyse systemische Betrachtung komplexer Sachverhalte im Fokus des Praktikums.
Voraussetzungen
Siehe Teilleistung.
Inhalt
Die Praktikumsteilnehmer erhalten die Möglichkeit, Ihre Kenntnisse aus dem Bereichen Datenmanagement und Datenanalyse zu vertiefen und praxisnah einzusetzen. Die zu bearbeitenden Aufgaben stammen aus den Teilgebieten:
- HPC Simulationen (z.B. Parallelisierung, MPI, Performance Engineering, etc.)
- HPC Systeme und Betriebsumgebung (z.B. On Demand File Systems, Infiniband-Netzwerke, Job-Scheduling)
- Maschinelles Lernen und Data Mining (z.B. RapidMiner, scikit)
- Daten-Intensives Rechnen (z.B. Hadoop, Spark)
- HPC und Datenanalyse mit Python (Numpy, Scipy, Pandas, Dask, Parsl)
- Verteilte & Parallele Dateisysteme (z.B. glusterFS, BeeGFS)
- Object Storage (z.B. S3, CEPH)
- Datenmanagement System (z.B. dCache, iRods)
- Datenbanken (SQL, NoSQL)
- Workflowmanagementsysteme für HPC und Datenanalyse (FireWorks, AiiDA, SimStack)
- Opportunistische Ressourceneinbindung und -nutzung (z.B. mittels COBalD/TARDIS)
- Authentifizierungs- und Autorisierungs-Infrastruktur (z.B. OpenID, SAML)
Die Studierenden werden durch wissenschaftliche Mitarbeitende des Scientific Centre for Computing (SCC) individuell betreut und können ihre Fähigkeiten durch Einbindung in aktuelle Forschungsaufgaben (z.B. Helmholtz-Programm, BMBF- und EU-Projekte) praxis- und forschungsnah einsetzen.
Themenvergabe und Planung der Präsenztermine erfolgt individuell zw. Praktikumsteilnehmer und Betreuer. Praktikumsteilnehmer bearbeiten separate Aufgabengebiete. Bei der Erstellung der Aufgabe werden eventuelle Vorkenntnisse und Interessensgebiete der Teilnehmer berücksichtigt.
Empfehlungen
Grundkenntnisse in den Bereichen Datenbanken, Datenmanagement, Datenanalyse, Parallelrechner oder Parallelprogrammierung sind hilfreich.
Arbeitsaufwand
3 SWS, 150 h/Semester
- 12 h Präsenzzeit in Praktikumsbesprechungen (Kick-Off, regelmäßige Betreuungstreffen, Abschlussveranstaltung
- 18 h Vor-/Nachbereitung der Praktikumsbesprechungen
- 120 h Bearbeitung des Themas und Erstellen der Prüfungsleistung