
05: Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2018/19, 27.11.2018
Author
Rüdiger Dillmann, Johann Marius Zöllner
Editor
Participating institute
Institut für Anthropomatik und Robotik (IAR)
Genre
Description
- 0:00:00 Start
- 0:08:20 Gesetz der Auswirkung
- 0:10:33 Lernen durch Belohnung/Bestrafung
- 0:12:06 Einordnung von Reinforcement Lerning
- 0:21:53 Reinforcement Lerning(RL)
- 0:27:04 Lernziel Reinforcement Lerning
- 0:30:18 Markov Decision Process(deterministisch)
- 0:43:10 Monte Carlo Methoden(MC)
- 0:47:14 Strategielernen - Policy learning
- 0:50:33 Optimale Strategie
- 0:52:16 Temporal-Difference Learning(TD)
- 0:54:39 Bootstrapping und Sampling
- 0:56:40 Taxonomie des Reinforcement Learning
- 0:57:59 Simple Temporal Difference Learning I (Simple Value Iteration)
- 1:03:58 Problemdimensionen beim RL
- 1:07:04 Die Q-Funktion
- 1:09:04 Q-Lernen Algorithmus
- 1:10:38 Suchstrategien / Experimentieren
- 1:11:16 Exploration vs. Exploitation
- 1:12:31 Optimierung
- 1:15:24 Repräsentation, Generalisierung
- 1:15:43 Nichtdeterministischer MDP
- 1:18:04 On-Policy Learning / Off-Policy Learning
- 1:19:14 Lernen von Aktionssequenzen
- 1:20:37 Eligibility Traces
- 1:21:05 SARSA-Algorithmus mit Eligibility Traces
- 1:21:29 Fahrstuhlsteuerung mit RL
- 1:22:17 TD - Gammon
- 1:23:12 BISAM
Duration (hh:mm:ss)
01:24:34
Series
Maschinelles Lernen 1 - Grundverfahren, WS 2018/19
Published on
27.11.2018
Subject area
License
Resolution | 1280 x 720 Pixel |
Aspect ratio | 16:9 |
Audio bitrate | 128000 bps |
Audio channels | 2 |
Audio Codec | aac |
Audio Sample Rate | 48000 Hz |
Total Bitrate | 934439 bps |
Color Space | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Media Type | video/mp4 |
Duration | 5074 s |
Filename | DIVA-2018-900_hd.mp4 |
File Size | 592.708.371 byte |
Frame Rate | 25 |
Video Bitrate | 800344 bps |
Video Codec | h264 |
Embed Code
Maschinelles Lernen 1 - Grundverfahren, WS 2018/19
Episodes 1-12
of 12