Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2016/17, 29.11.2016, 03
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:06 Reinforcement Learning
- 0:12:26 Organisatorisches
- 0:12:56 Gesetz der Auswirkung
- 0:14:47 Lernen mit Belohnung
- 0:16:23 Reinforcement Learning (RL)
- 0:20:39 Lernziel RL
- 0:22:55 Markov decision process (deterministisch)
- 0:26:21 Markov decision process
- 0:30:00 RL: Anwendungsbeispiele
- 0:32:40 Strategielernen - Policy learning
- 0:38:29 Optimale Strategie
- 0:39:17 Simple Temporal Difference Learning I (Simple Value Iteration)
- 0:40:11 Beispiel
- 0:42:25 Simple Temporal Difference Learning II
- 0:43:32 Problemdimensionen beim RL
- 0:46:16 RL: Einteilung, Q-Lernen, Erweiterungen
- 0:49:27 Die Q-Funktion
- 0:50:56 Beispiel
- 0:52:50 Q-Lernen Algorithmus
- 0:54:20 Suchstrategien / Experimentieren
- 0:55:16 Exploration vs. Exploitation
- 0:56:24 Optimierungen
- 0:57:49 Repräsentation, Generalisierung
- 0:59:25 Nichtdeterministischer MDP
- 1:00:19 Lernen von Aktionssequenzen
- 1:00:57 Warum Lernen von Aktionssequenzen?
- 1:02:30 Lernen von Aktionssequenzen
- 1:03:59 TD-Lernen und Eligibility Traces
- 1:04:42 Eligibility Traces
- 1:05:24 SARSA(λ)-Algorithmus mit Eligibility Traces
- 1:05:45 SARSA Beispiel
- 1:06:26 Beispiele
- 1:06:59 Fahrstuhlsteuerung mit RL (Crites96)
- 1:08:08 Fahrstuhlsteuerung - Randbedingungen des Lernens
- 1:09:00 Fahrstuhlsteurung - Netzrepräsentation
- 1:10:02 Fahrstuhlsteuerung - Ergebnisse
- 1:10:48 TD - Gammon
- 1:13:20 Online-Lernen auf der vierbeinigen Laufmaschine BISAM (IIg00/Albiez00)
- 1:14:30 BISAM - Dynamisch und Statisch stabiles Laufen
- 1:15:29 BISAM - Steuerungsarchitektur
- 1:15:52 BISAM - Lernen der Gewichtsverlagerung im Schritt
- 1:16:06 BISAM - Bewertung des Schwerpunktsverlaufes im Kreuzgang
- 1:16:21 BISAM - Lernverlauf Kreuzgang
- 1:17:22 Literatur
Laufzeit (hh:mm:ss)
01:18:22
Serie
Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2016/17
Publiziert am
27.12.2016
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 88478 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 893504 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 4702 s |
Dateiname | DIVA-2016-841_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 798932 bps |
Video Codec | h264 |
Embed-Code
Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2016/17
Folgen 1-11
von 11