Modul
Data Science [M-INFO-106505]
Leistungspunkte
8Turnus
Jedes WintersemesterDauer
2 SemesterSprache
DeutschLevel
4Version
1Verantwortung
Einrichtung
- KIT-Fakultät für Informatik
Bestandteil von
Teilleistungen
Identifier | Name | LP |
---|---|---|
T-INFO-113124 | Data Science | 8 |
Erfolgskontrolle(n)
Siehe Teilleistung.
Qualifikationsziele
Am Ende der Lehrveranstaltungen sollen die Teilnehmer die Notwendigkeit von Data-Science Konzepten gut verstanden haben und erläutern können. Sie sollen eine große Vielfalt von Ansätzen zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich Data Science derzeit offen sind, und einen breiten und tiefen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.
Voraussetzungen
Siehe Teilleistung.
Inhalt
Data Science 1
Data-Science Techniken stoßen bei Anwendern auf großes Interesse. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. Diese Vorlesung behandelt die notwendigen Schritte zur Extraktion von Wissen aus Daten, Techniken zur Aufbereitung der Daten bis hin zu grundlegenden Modellen zur Extraktion von Wissen, z. B. in Form von Statistiken, Assoziationsregeln, Clustern oder systematischen Vorhersagen.
Data Science 2
Die Vorlesung "Data Science 2" setzt die folgenden Schwerpunkte: Hochdimensionale Daten und ihre Eigenheiten und Verfahren für ihre Analyse, Datenströme und entsprechende Ansätze, Datenvorverarbeitung in Form von beispielsweise Data Cleaning.
Empfehlungen
Datenbankkenntnisse, z.B. aus der Vorlesung Datenbanksysteme
Arbeitsaufwand
240h