KIT-Bibliothek

Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2016/17, 29.11.2016, 03

Diese Audio- bzw. Video-Datei ist urheberrechtlich geschützt. Der Zugriff ist nur über Rechner des Karlsruher Instituts für Technologie (KIT) erlaubt.

Autor

Rüdiger Dillmann

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:06 Reinforcement Learning
  • 0:12:26 Organisatorisches
  • 0:12:56 Gesetz der Auswirkung
  • 0:14:47 Lernen mit Belohnung
  • 0:16:23 Reinforcement Learning (RL)
  • 0:20:39 Lernziel RL
  • 0:22:55 Markov decision process (deterministisch)
  • 0:26:21 Markov decision process
  • 0:30:00 RL: Anwendungsbeispiele
  • 0:32:40 Strategielernen - Policy learning
  • 0:38:29 Optimale Strategie
  • 0:39:17 Simple Temporal Difference Learning I (Simple Value Iteration)
  • 0:40:11 Beispiel
  • 0:42:25 Simple Temporal Difference Learning II
  • 0:43:32 Problemdimensionen beim RL
  • 0:46:16 RL: Einteilung, Q-Lernen, Erweiterungen
  • 0:49:27 Die Q-Funktion
  • 0:50:56 Beispiel
  • 0:52:50 Q-Lernen Algorithmus
  • 0:54:20 Suchstrategien / Experimentieren
  • 0:55:16 Exploration vs. Exploitation
  • 0:56:24 Optimierungen
  • 0:57:49 Repräsentation, Generalisierung
  • 0:59:25 Nichtdeterministischer MDP
  • 1:00:19 Lernen von Aktionssequenzen
  • 1:00:57 Warum Lernen von Aktionssequenzen?
  • 1:02:30 Lernen von Aktionssequenzen
  • 1:03:59 TD-Lernen und Eligibility Traces
  • 1:04:42 Eligibility Traces
  • 1:05:24 SARSA(λ)-Algorithmus mit Eligibility Traces
  • 1:05:45 SARSA Beispiel
  • 1:06:26 Beispiele
  • 1:06:59 Fahrstuhlsteuerung mit RL (Crites96)
  • 1:08:08 Fahrstuhlsteuerung - Randbedingungen des Lernens
  • 1:09:00 Fahrstuhlsteurung - Netzrepräsentation
  • 1:10:02 Fahrstuhlsteuerung - Ergebnisse
  • 1:10:48 TD - Gammon
  • 1:13:20 Online-Lernen auf der vierbeinigen Laufmaschine BISAM (IIg00/Albiez00)
  • 1:14:30 BISAM - Dynamisch und Statisch stabiles Laufen
  • 1:15:29 BISAM - Steuerungsarchitektur
  • 1:15:52 BISAM - Lernen der Gewichtsverlagerung im Schritt
  • 1:16:06 BISAM - Bewertung des Schwerpunktsverlaufes im Kreuzgang
  • 1:16:21 BISAM - Lernverlauf Kreuzgang
  • 1:17:22 Literatur

Laufzeit (hh:mm:ss)

01:18:22

Serie

Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2016/17

Publiziert am

27.12.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 88478 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 893504 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4702 s
Dateiname DIVA-2016-841_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 798932 bps
Video Codec h264

Embed-Code