05: Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2018/19, 27.11.2018
Autor
Rüdiger Dillmann, Johann Marius Zöllner
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Start
- 0:08:20 Gesetz der Auswirkung
- 0:10:33 Lernen durch Belohnung/Bestrafung
- 0:12:06 Einordnung von Reinforcement Lerning
- 0:21:53 Reinforcement Lerning(RL)
- 0:27:04 Lernziel Reinforcement Lerning
- 0:30:18 Markov Decision Process(deterministisch)
- 0:43:10 Monte Carlo Methoden(MC)
- 0:47:14 Strategielernen - Policy learning
- 0:50:33 Optimale Strategie
- 0:52:16 Temporal-Difference Learning(TD)
- 0:54:39 Bootstrapping und Sampling
- 0:56:40 Taxonomie des Reinforcement Learning
- 0:57:59 Simple Temporal Difference Learning I (Simple Value Iteration)
- 1:03:58 Problemdimensionen beim RL
- 1:07:04 Die Q-Funktion
- 1:09:04 Q-Lernen Algorithmus
- 1:10:38 Suchstrategien / Experimentieren
- 1:11:16 Exploration vs. Exploitation
- 1:12:31 Optimierung
- 1:15:24 Repräsentation, Generalisierung
- 1:15:43 Nichtdeterministischer MDP
- 1:18:04 On-Policy Learning / Off-Policy Learning
- 1:19:14 Lernen von Aktionssequenzen
- 1:20:37 Eligibility Traces
- 1:21:05 SARSA-Algorithmus mit Eligibility Traces
- 1:21:29 Fahrstuhlsteuerung mit RL
- 1:22:17 TD - Gammon
- 1:23:12 BISAM
Laufzeit (hh:mm:ss)
01:24:34
Serie
Maschinelles Lernen 1 - Grundverfahren, WS 2018/19
Publiziert am
27.11.2018
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 128000 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 934439 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5074 s |
Dateiname | DIVA-2018-900_hd.mp4 |
Dateigröße | 592.708.371 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 800344 bps |
Video Codec | h264 |
Embed-Code
Maschinelles Lernen 1 - Grundverfahren, WS 2018/19
Folgen 1-12
von 12