04: Maschinelles Lernen 2 - Fortgeschrittene Verfahren , Vorlesung, SS 2017, 23.06.2017
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:28 Inhalt
- 0:01:03 RL - ""Statistik""
- 0:02:02 RL - Anwendungsfelder
- 0:03:20 Wieso RL? - Lernen mit Belohnung
- 0:05:09 Markov decision process (deterministisch)
- 0:07:14 Episodischer MDP
- 0:09:02 Strategielernen - Policy learning
- 0:11:55 Die V- und Q-Funktion (value- bzw state-action function) - Bellmann Gleichungen
- 0:15:32 RL: Entscheiden während des Lernens
- 0:20:14 Erweiterte Ansätze des RL
- 0:22:20 Was tun? - Grundsätzliche Aspekte
- 0:22:58 Grundsätzliche Ansätze: Modellbasiert
- 0:23:41 Grundsätzliche Ansätze: Modellbasiert Lernen
- 0:24:20 Grundsätzliche Ansätze: Modellfrei -> Funktionsapproximation
- 0:24:51 Effiziente Funktionsapproximation
- 0:26:58 Realisierung: Fitted Q-Iteration
- 0:30:44 Hierarchisches RL
- 0:32:31 Printerbot - Klassischer Ansatz Problematik
- 0:33:59 Printerbot - Typische Aktionen
- 0:35:47 Hierarchisches RL - Zielsetzung
- 0:38:09 Options (Sutton, Precup, Singh'99) -> Teilaktion
- 0:40:35 Lernen auf Options
- 0:41:27 Semi - MDP
- 0:42:40 Semi - MDP - Lernschritt (vgl. Sarsa)
- 0:44:25 Options - nichtdeterministischer Semi-MDP
- 0:46:24 Diskussion Options
- 0:48:35 Deep Reinforcement Learning
- 0:53:09 Experience Replay
- 0:54:55 Training mit Experience Replay
- 0:59:25 Verwendung eines Sollwert-Netzwerks
- 1:00:56 Anwendungsbeispiele
- 1:07:10 Erweiterungen des Deep Q-Learning
- 1:17:12 Thinking Big...
Laufzeit (hh:mm:ss)
01:18:41
Serie
Maschinelles Lernen 2 - Fortgeschrittene Verfahren, Vorlesung, SS 2017
Publiziert am
04.07.2017
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 119590 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 903905 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 4721 s |
Dateiname | DIVA-2017-377_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 778219 bps |
Video Codec | h264 |
Embed-Code
Maschinelles Lernen 2 - Fortgeschrittene Verfahren, Vorlesung, SS 2017
Folgen 1-8
von 8