KIT-Bibliothek
Audio-/Videodatei publizieren

04: Maschinelles Lernen 2 - Fortgeschrittene Verfahren , Vorlesung, SS 2017, 23.06.2017

Diese Audio- bzw. Video-Datei ist urheberrechtlich geschützt. Der Zugriff ist nur über Rechner des Karlsruher Instituts für Technologie (KIT) erlaubt.

Autor

Peter Wolf

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:28 Inhalt
  • 0:01:03 RL - ""Statistik""
  • 0:02:02 RL - Anwendungsfelder
  • 0:03:20 Wieso RL? - Lernen mit Belohnung
  • 0:05:09 Markov decision process (deterministisch)
  • 0:07:14 Episodischer MDP
  • 0:09:02 Strategielernen - Policy learning
  • 0:11:55 Die V- und Q-Funktion (value- bzw state-action function) - Bellmann Gleichungen
  • 0:15:32 RL: Entscheiden während des Lernens
  • 0:20:14 Erweiterte Ansätze des RL
  • 0:22:20 Was tun? - Grundsätzliche Aspekte
  • 0:22:58 Grundsätzliche Ansätze: Modellbasiert
  • 0:23:41 Grundsätzliche Ansätze: Modellbasiert Lernen
  • 0:24:20 Grundsätzliche Ansätze: Modellfrei -> Funktionsapproximation
  • 0:24:51 Effiziente Funktionsapproximation
  • 0:26:58 Realisierung: Fitted Q-Iteration
  • 0:30:44 Hierarchisches RL
  • 0:32:31 Printerbot - Klassischer Ansatz Problematik
  • 0:33:59 Printerbot - Typische Aktionen
  • 0:35:47 Hierarchisches RL - Zielsetzung
  • 0:38:09 Options (Sutton, Precup, Singh'99) -> Teilaktion
  • 0:40:35 Lernen auf Options
  • 0:41:27 Semi - MDP
  • 0:42:40 Semi - MDP - Lernschritt (vgl. Sarsa)
  • 0:44:25 Options - nichtdeterministischer Semi-MDP
  • 0:46:24 Diskussion Options
  • 0:48:35 Deep Reinforcement Learning
  • 0:53:09 Experience Replay
  • 0:54:55 Training mit Experience Replay
  • 0:59:25 Verwendung eines Sollwert-Netzwerks
  • 1:00:56 Anwendungsbeispiele
  • 1:07:10 Erweiterungen des Deep Q-Learning
  • 1:17:12 Thinking Big...

Laufzeit (hh:mm:ss)

01:18:41

Serie

Maschinelles Lernen 2 - Fortgeschrittene Verfahren, Vorlesung, SS 2017

Publiziert am

04.07.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 119590 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 903905 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4721 s
Dateiname DIVA-2017-377_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 778219 bps
Video Codec h264

Embed-Code