05: Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2018/19, 27.11.2018
Autor
Rüdiger Dillmann, Johann Marius Zöllner
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
05 |
0:00:00 Start
0:08:20 Gesetz der Auswirkung
0:10:33 Lernen durch Belohnung/Bestrafung
0:12:06 Einordnung von Reinforcement Lerning
0:21:53 Reinforcement Lerning(RL)
0:27:04 Lernziel Reinforcement Lerning
0:30:18 Markov Decision Process(deterministisch)
0:43:10 Monte Carlo Methoden(MC)
0:47:14 Strategielernen - Policy learning
0:50:33 Optimale Strategie
0:52:16 Temporal-Difference Learning(TD)
0:54:39 Bootstrapping und Sampling
0:56:40 Taxonomie des Reinforcement Learning
0:57:59 Simple Temporal Difference Learning I (Simple Value Iteration)
1:03:58 Problemdimensionen beim RL
1:07:04 Die Q-Funktion
1:09:04 Q-Lernen Algorithmus
1:10:38 Suchstrategien / Experimentieren
1:11:16 Exploration vs. Exploitation
1:12:31 Optimierung
1:15:24 Repräsentation, Generalisierung
1:15:43 Nichtdeterministischer MDP
1:18:04 On-Policy Learning / Off-Policy Learning
1:19:14 Lernen von Aktionssequenzen
1:20:37 Eligibility Traces
1:21:05 SARSA-Algorithmus mit Eligibility Traces
1:21:29 Fahrstuhlsteuerung mit RL
1:22:17 TD - Gammon
1:23:12 BISAM
Laufzeit (hh:mm:ss)
01:24:34
Serie
Maschinelles Lernen 1 - Grundverfahren, WS 2018/19
Publiziert am
27.11.2018
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 128000 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 934439 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5074 s |
Dateiname | DIVA-2018-900_hd.mp4 |
Dateigröße | 592.708.371 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 800344 bps |
Video Codec | h264 |
Embed-Code