Modul

Deep Learning für Computer Vision II: Fortgeschrittene Themen [M-INFO-105755]

Leistungspunkte

Turnus

Jedes Wintersemester

Dauer

1 Semester

Sprache

Deutsch/Englisch

Level

Version

Verantwortung

Prof. Dr.-Ing. Rainer Stiefelhagen

Einrichtung

KIT-Fakultät für Informatik

Bestandteil von

Wirtschaftsinformatik (M.Sc.)

Teilleistungen

Identifier	Name	LP
T-INFO-111494	Deep Learning für Computer Vision II: Fortgeschrittene Themen	3

Erfolgskontrolle(n)

Siehe Teilleistung.

Qualifikationsziele

Studierende bekommen ein Verständnis der fortgeschrittenen Deep Learning Verfahren und Aufgabenstellungen insb. im Hinblick auf ihre Anwendungen in der Bildverarbeitung (Computer Vision). Studierende sind in der Lage, Deep Learning Verfahren für spezielle Aufgabenstellungen, wie Lernen mit wenig Trainingsdaten, Änderungen der Datendomäne oder Unsicherheitsbestimmung anzuwenden.

Voraussetzungen

Siehe Teilleistung.

Inhalt

Tiefe faltende neuronale Netze (engl. Convolutional Neural Networks, CNNs) erzielen exzellente Ergebnisse in vielen Bereichen der Computer Vision, haben jedoch bei realen Anwendungen mit Herausforderungen zu kämpfen, wie die Abhängigkeit von kostspielig annotierten Trainingsdaten, hohe Rechenleistung oder schwere Nachvollziehbarkeit der Entscheidungswege. Während die Entwicklung der Erkennungsalgorithmen für lange Zeit primär von hohen Erkennungsraten auf großen und sauber annotierten Datensätzen getrieben waren, gewinnen heute anwendungsrelevante Ziele, wie Lernen mit wenig Trainingsdaten, Erklärbarkeit, Unsicherheitsschätzung oder Domänenadaption zunehmend an Bedeutung.

Die Vorlesung behandelt fortgeschrittene Netzarchitekturen, Lernverfahren und Forschungsgebiete im Bereich Deep Learning für Computer Vision. Es werden unter anderem folgende Themen behandelt:

Überblick Deep Learning, Faltende Neuronale Netze (CNN), Probleme moderner Architekturen
Interpretierbarkeit und Erklärbarkeit der CNNs
Unsicherheit in Deep Learning
Lernen mit wenig Trainingsdaten
Effiziente Architekturen
Fortgeschrittene Architekturen (Transformer, Graph Neural Networks)
Synergien von Computer Vision und Sprachmodellen
Generative Adversarial Networks (GANs)
Kontinuierliches Lernen

Empfehlungen

Kenntnisse zu Deep Learning Grundlagen werden vorausgesetzt.

Arbeitsaufwand

Besuch der Vorlesungen: ca. 20 Stunden

Vor- und Nachbereitung der Vorlesung: ca. 30 Stunden

Klausurvorbereitung: ca. 40 h

Summe: ca. 90 Stunden