Modul
Reinforcement Learning und neuronale Netze in der Robotik [M-INFO-104894]
Leistungspunkte
3Turnus
Jedes SommersemesterDauer
1 SemesterSprache
EnglischLevel
4Version
1Einrichtung
- KIT-Fakultät für Informatik
Bestandteil von
Teilleistungen
Identifier | Name | LP |
---|---|---|
T-INFO-109928 | Reinforcement Learning und neuronale Netze in der Robotik | 3 |
Erfolgskontrolle(n)
Siehe Teilleistung.
Qualifikationsziele
Die Teilnehmer kennen aktuelle, daten-getriebene Repräsentationen und Algorithmen zum Steuern stationärer und mobiler Roboter. Im ersten Teil der Vorlesung werden grundlegende Konzepte im Hinblick auf das überwachte und imitationsgestützte Trainieren tiefer neuronaler Netze mittels Optimierungsverfahren eingeführt. Hierbei wird eine vollständige Vorlesung der praktischen Anwendung von Netzen in der Robotik gewidmet. Im zweiten Teil der Vorlesung werden verschiedene Ansätze des Reinforcement Learnings mit zugehörigen Lernverfahren vertieft. Vorlesungsbegleitend werden Fallstudien aus der Robotik-Forschung diskutiert.
Lernziele:
- Erfolgreiche Teilnehmer beherrschen die konzeptionellen Grundlagen des maschinellen Lernens und der in diesem Kontext eingesetzten mathematischen Optimierungsverfahren (Gradienten-basierte Methoden).
- Erfolgreiche Teilnehmer verstehen die Repräsentationen (Feed-forward und Recurrent Networks) und Algorithmen (Back-propagation) im überwachten und imitationsgestützten Deep Learning. Sie können sie selbstständig auf praktische Probleme des Lernens von Roboterverhalten anwenden.
- Erfolgreiche Teilnehmer beherrschen die Terminologie des Reinforcement Learnings, dessen stochastische Grundlagen (MDP), modellfreie Lernmethoden (MC, TD, SARSA, Q-), Policy-Gradienten Ansätze (Actor-Critic, TRPO, PPO) und modellbasierte Ansätze (globale und lokale Modelle). Sie können auf Basis dessen Lösungen zum Lernen motorischer Roboterfähigkeiten entwerfen.
Voraussetzungen
Siehe Teilleistung.
Inhalt
- Einführung und Grundlagen des maschinellen Lernens
- Optimierung im maschinellen Lernen
- Einführung in das überwachte (Deep) Learning
- Gastvorlesung – Innovative praktische Anwendungen
- Einführung in das (Deep) Imitation Learning
- Einführung in das (Deep) Reinforcement Learning
- Markov-Entscheidungsprozesse und dynamisches Programmieren
- Monte-Carlo Lernen und Time Difference
- Basic Policy Gradients
- Advanced Policy Gradients
- Modellbasiertes Reinforcement Learning
Empfehlungen
- Erfolgreicher Abschluss des Moduls Grundbegriffe der Informatik [IN1INGI]
- Erfolgreicher Abschluss des Moduls Höhere Mathematik [M-MATH-101305]
- Erfolgreicher Abschluss des Moduls Wahrscheinlichkeitstheorie u. Statistik [M-MATH-101308]
Arbeitsaufwand
(2 SWS + 1 SWS) x 15 + 45 h Prüfungsvorbereitung = 90 h = 3 ECTS