EN

Modul

Analysetechniken für große Datenbestände 2 [M-INFO-102773]

Leistungspunkte
3
Turnus
Unregelmäßig
Dauer
1 Semester
Sprache
Deutsch
Level
4
Version
1

Verantwortung

Einrichtung

  • KIT-Fakultät für Informatik

Bestandteil von

Teilleistungen

Identifier Name LP
T-INFO-105742 Analysetechniken für große Datenbestände 2 3

Erfolgskontrolle(n)

Siehe Teilleistung.

Qualifikationsziele

Am Ende der Lehrveranstaltung sollen die Teilnehmer die Notwendigkeit fortgeschrittener Konzepte der Datenanalyse gut verstanden haben und erläutern können. Sie sollen eine große Vielfalt von Ansätzen zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich Datenanalyse derzeit offen sind, und einen breiten und tiefen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben

Voraussetzungen

Siehe Teilleistung.

Inhalt

Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. In der Vorlesung geht es sowohl um die Aufbereitung von Daten als Voraussetzung für eine schnelle und leistungsfähige Analyse als auch um moderne Techniken für die Analyse an sich. Die Lehrveranstaltung legt einen Schwerpunkt auf Phänomene und Techniken, die in der Vorlesung ‚Analysetechniken für große Datenbestände‘ nicht betrachtet wurden; dies sind Ansätze für Datenströme, Besonderheiten hochdimensionaler Datenbestände, Erschließung von Datenbeständen mit Methoden der Informationsintegration und des Data Warehousing sowie Komprimierung und Sampling großer Datenbestände.

Arbeitsaufwand

2 SWS = 2 h Präsenzzeit / Woche
 Vor- und Nachbereitungszeiten 2  h / 1 SWS
15 Vorlesungswochen / Semester - 3ECTS=90h
(2 SWS + 2 x 2 SWS) x 15 + 15 h Klausurvorbereitung = 105 h = 3 ECTS