Modul
Deep Learning für Computer Vision II: Fortgeschrittene Themen [M-INFO-105755]
Leistungspunkte
3Turnus
Jedes WintersemesterDauer
1 SemesterSprache
Deutsch/EnglischLevel
4Version
3Verantwortung
Einrichtung
- KIT-Fakultät für Informatik
Bestandteil von
Teilleistungen
Identifier | Name | LP |
---|---|---|
T-INFO-111494 | Deep Learning für Computer Vision II: Fortgeschrittene Themen | 3 |
Erfolgskontrolle(n)
Siehe Teilleistung.
Qualifikationsziele
Studierende bekommen ein Verständnis der fortgeschrittenen Deep Learning Verfahren und Aufgabenstellungen insb. im Hinblick auf ihre Anwendungen in der Bildverarbeitung (Computer Vision). Studierende sind in der Lage, Deep Learning Verfahren für spezielle Aufgabenstellungen, wie Lernen mit wenig Trainingsdaten, Änderungen der Datendomäne oder Unsicherheitsbestimmung anzuwenden.
Voraussetzungen
Siehe Teilleistung.
Inhalt
Tiefe faltende neuronale Netze (engl. Convolutional Neural Networks, CNNs) erzielen exzellente Ergebnisse in vielen Bereichen der Computer Vision, haben jedoch bei realen Anwendungen mit Herausforderungen zu kämpfen, wie die Abhängigkeit von kostspielig annotierten Trainingsdaten, hohe Rechenleistung oder schwere Nachvollziehbarkeit der Entscheidungswege. Während die Entwicklung der Erkennungsalgorithmen für lange Zeit primär von hohen Erkennungsraten auf großen und sauber annotierten Datensätzen getrieben waren, gewinnen heute anwendungsrelevante Ziele, wie Lernen mit wenig Trainingsdaten, Erklärbarkeit, Unsicherheitsschätzung oder Domänenadaption zunehmend an Bedeutung.
Die Vorlesung behandelt fortgeschrittene Netzarchitekturen, Lernverfahren und Forschungsgebiete im Bereich Deep Learning für Computer Vision. Es werden unter anderem folgende Themen behandelt:
- Überblick Deep Learning, Faltende Neuronale Netze (CNN), Probleme moderner Architekturen
- Interpretierbarkeit und Erklärbarkeit der CNNs
- Unsicherheit in Deep Learning
- Lernen mit wenig Trainingsdaten
- Effiziente Architekturen
- Fortgeschrittene Architekturen (Transformer, Graph Neural Networks)
- Synergien von Computer Vision und Sprachmodellen
- Generative Adversarial Networks (GANs)
- Kontinuierliches Lernen
Empfehlungen
Kenntnisse zu Deep Learning Grundlagen werden vorausgesetzt.
Arbeitsaufwand
Besuch der Vorlesungen: ca. 20 Stunden
Vor- und Nachbereitung der Vorlesung: ca. 30 Stunden
Klausurvorbereitung: ca. 40 h
Summe: ca. 90 Stunden