Modul

Reinforcement Learning und neuronale Netze in der Robotik [M-INFO-104894]

Leistungspunkte

Turnus

Jedes Sommersemester

Dauer

1 Semester

Sprache

Englisch

Level

Version

Verantwortung

Einrichtung

KIT-Fakultät für Informatik

Bestandteil von

Wirtschaftsinformatik (M.Sc.)

Teilleistungen

Identifier	Name	LP
T-INFO-109928	Reinforcement Learning und neuronale Netze in der Robotik	3

Erfolgskontrolle(n)

Siehe Teilleistung.

Qualifikationsziele

Die Teilnehmer kennen aktuelle, daten-getriebene Repräsentationen und Algorithmen zum Steuern stationärer und mobiler Roboter. Im ersten Teil der Vorlesung werden grundlegende Konzepte im Hinblick auf das überwachte und imitationsgestützte Trainieren tiefer neuronaler Netze mittels Optimierungsverfahren eingeführt. Hierbei wird eine vollständige Vorlesung der praktischen Anwendung von Netzen in der Robotik gewidmet. Im zweiten Teil der Vorlesung werden verschiedene Ansätze des Reinforcement Learnings mit zugehörigen Lernverfahren vertieft. Vorlesungsbegleitend werden Fallstudien aus der Robotik-Forschung diskutiert.

Lernziele:
- Erfolgreiche Teilnehmer beherrschen die konzeptionellen Grundlagen des maschinellen Lernens und der in diesem Kontext eingesetzten mathematischen Optimierungsverfahren (Gradienten-basierte Methoden).
- Erfolgreiche Teilnehmer verstehen die Repräsentationen (Feed-forward und Recurrent Networks) und Algorithmen (Back-propagation) im überwachten und imitationsgestützten Deep Learning. Sie können sie selbstständig auf praktische Probleme des Lernens von Roboterverhalten anwenden.
- Erfolgreiche Teilnehmer beherrschen die Terminologie des Reinforcement Learnings, dessen stochastische Grundlagen (MDP), modellfreie Lernmethoden (MC, TD, SARSA, Q-), Policy-Gradienten Ansätze (Actor-Critic, TRPO, PPO) und modellbasierte Ansätze (globale und lokale Modelle). Sie können auf Basis dessen Lösungen zum Lernen motorischer Roboterfähigkeiten entwerfen.

Voraussetzungen

Siehe Teilleistung.

Inhalt

- Einführung und Grundlagen des maschinellen Lernens
- Optimierung im maschinellen Lernen
- Einführung in das überwachte (Deep) Learning
- Gastvorlesung – Innovative praktische Anwendungen
- Einführung in das (Deep) Imitation Learning
- Einführung in das (Deep) Reinforcement Learning
- Markov-Entscheidungsprozesse und dynamisches Programmieren
- Monte-Carlo Lernen und Time Difference
- Basic Policy Gradients
- Advanced Policy Gradients
- Modellbasiertes Reinforcement Learning

Empfehlungen

- Erfolgreicher Abschluss des Moduls Grundbegriffe der Informatik [IN1INGI]
- Erfolgreicher Abschluss des Moduls Höhere Mathematik [M-MATH-101305]
- Erfolgreicher Abschluss des Moduls Wahrscheinlichkeitstheorie u. Statistik [M-MATH-101308]

Arbeitsaufwand

(2 SWS + 1 SWS) x 15 + 45 h Prüfungsvorbereitung = 90 h = 3 ECTS