EN

Modul

Data Science [M-INFO-106505]

Leistungspunkte
8
Turnus
Jedes Wintersemester
Dauer
2 Semester
Sprache
Deutsch
Level
4
Version
1

Verantwortung

Einrichtung

  • KIT-Fakultät für Informatik

Bestandteil von

Teilleistungen

Identifier Name LP
T-INFO-113124 Data Science 8

Erfolgskontrolle(n)

Siehe Teilleistung.

Qualifikationsziele

Am Ende der Lehrveranstaltungen sollen die Teilnehmer die Notwendigkeit von Data-Science Konzepten gut verstanden haben und erläutern können. Sie sollen eine große Vielfalt von Ansätzen zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich Data Science derzeit offen sind, und einen breiten und tiefen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.

Voraussetzungen

Siehe Teilleistung.

Inhalt

Data Science 1

Data-Science Techniken stoßen bei Anwendern auf großes Interesse. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. Diese Vorlesung behandelt die notwendigen Schritte zur Extraktion von Wissen aus Daten, Techniken zur Aufbereitung der Daten bis hin zu grundlegenden Modellen zur Extraktion von Wissen, z. B. in Form von Statistiken, Assoziationsregeln, Clustern oder systematischen Vorhersagen.

Data Science 2

Die Vorlesung "Data Science 2" setzt die folgenden Schwerpunkte: Hochdimensionale Daten und ihre Eigenheiten und Verfahren für ihre Analyse, Datenströme und entsprechende Ansätze, Datenvorverarbeitung in Form von beispielsweise Data Cleaning.

Empfehlungen

Datenbankkenntnisse, z.B. aus der Vorlesung Datenbanksysteme

Arbeitsaufwand

240h