EN

Modul

Praktikum: Analyse großer Datenbestände [M-INFO-101663]

Leistungspunkte
6
Turnus
Jedes Sommersemester
Dauer
1 Semester
Sprache
Deutsch
Level
4
Version
2

Verantwortung

Einrichtung

  • KIT-Fakultät für Informatik

Bestandteil von

Teilleistungen

Identifier Name LP
T-INFO-103202 Praktikum: Analyse großer Datenbestände 6

Erfolgskontrolle(n)

Siehe Teilleistung

Qualifikationsziele

Die Teilnehmer und Teilnehmerinnen des Praktikums sollen das in der Vorlesung „Analysetechniken für große Datenbestände“ erlernte Wissen über Data Mining systematisch und vertieft anwenden, mit Beispielen aus der Praxis von realistischer Komplexität. Dabei sollen die Studierenden gängige Softwaretools im Bereich Datenanalyse kennenlernen und einsetzen. Die Studierenden werden mit der Vorverarbeitung von Rohdaten sowie mit den Analyseschritten im KDD-Prozess vertraut gemacht. Sie sollen lernen, wie man sowohl mit handelsüblichen als auch sehr modernen Analysetools die bestmöglichen Ergebnisse in einer gegebenen Anwendung erzielen kann. Darüber hinaus sollen die Studierenden lernen, im Team zusammenzuarbeiten, um die gestellten Aufgaben erfolgreich zu lösen. Das Praktikum soll sie dazu befähigen, verständlich Ergebnisse und Vorgehensweisen sowohl innerhalb als auch außerhalb ihres Teams zu kommunizieren.

Voraussetzungen

Siehe Teilleistung

Inhalt

Im Rahmen des Praktikums „Analyse großer Datenbestände“ wird das theoretische Wissen aus der Vorlesung „Analysetechniken für große Datenbestände“ mit Hilfe gängiger Softwaretools praktisch vertieft. Die Veranstaltung teilt sich in mehrere Blöcke, in denen die Teilnehmer jeweils einen KDD-Prozess, d. h. die Wissensextraktion und Datenexploration in einem konkreten Anwendungsfall, durchgehen. Dabei werden verschiedene Data Mining Verfahren näher beleuchtet. Der Fokus liegt auf modernen Verfahren zum Clustering, der Klassifikation sowie der Bestimmung von Frequent Itemsets und Association Rules. Die Bearbeitung der einzelnen Aufgaben erfolgt in Teams.

Arbeitsaufwand

Präsenzzeit (15 x 2) = 30 h
Einarbeitung 25h
Eigenverantwortliches Arbeiten 105 h
Präsentationsvorbereitung 20h

Summe: 180h