KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

04: Maschinelles Lernen 2 - Fortgeschrittene Verfahren , Vorlesung, SS 2017, 23.06.2017

Diese Audio- bzw. Video-Datei ist urheberrechtlich geschützt. Der Zugriff ist nur über Rechner des Karlsruher Instituts für Technologie (KIT) erlaubt.

Autor

Peter Wolf

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

04 |
0:00:00 Starten
0:00:28 Inhalt
0:01:03 RL - ""Statistik""
0:02:02 RL - Anwendungsfelder
0:03:20 Wieso RL? - Lernen mit Belohnung
0:05:09 Markov decision process (deterministisch)
0:07:14 Episodischer MDP
0:09:02 Strategielernen - Policy learning
0:11:55 Die V- und Q-Funktion (value- bzw state-action function) - Bellmann Gleichungen
0:15:32 RL: Entscheiden während des Lernens
0:20:14 Erweiterte Ansätze des RL
0:22:20 Was tun? - Grundsätzliche Aspekte
0:22:58 Grundsätzliche Ansätze: Modellbasiert
0:23:41 Grundsätzliche Ansätze: Modellbasiert Lernen
0:24:20 Grundsätzliche Ansätze: Modellfrei -> Funktionsapproximation
0:24:51 Effiziente Funktionsapproximation
0:26:58 Realisierung: Fitted Q-Iteration
0:30:44 Hierarchisches RL
0:32:31 Printerbot - Klassischer Ansatz Problematik
0:33:59 Printerbot - Typische Aktionen
0:35:47 Hierarchisches RL - Zielsetzung
0:38:09 Options (Sutton, Precup, Singh'99) -> Teilaktion
0:40:35 Lernen auf Options
0:41:27 Semi - MDP
0:42:40 Semi - MDP - Lernschritt (vgl. Sarsa)
0:44:25 Options - nichtdeterministischer Semi-MDP
0:46:24 Diskussion Options
0:48:35 Deep Reinforcement Learning
0:53:09 Experience Replay
0:54:55 Training mit Experience Replay
0:59:25 Verwendung eines Sollwert-Netzwerks
1:00:56 Anwendungsbeispiele
1:07:10 Erweiterungen des Deep Q-Learning
1:17:12 Thinking Big...

Laufzeit (hh:mm:ss)

01:18:41

Serie

Maschinelles Lernen 2 - Fortgeschrittene Verfahren, Vorlesung, SS 2017

Publiziert am

04.07.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 119590 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 903905 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4721 s
Dateiname DIVA-2017-377_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 778219 kbps
Video Codec h264

Embed-Code