KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

05: Maschinelles Lernen 1 - Grundverfahren, Vorlesung, WS 2018/19, 27.11.2018

Diese Audio- bzw. Video-Datei ist urheberrechtlich geschützt. Der Zugriff ist nur über Rechner des Karlsruher Instituts für Technologie (KIT) erlaubt.

Autor

Rüdiger Dillmann, Johann Marius Zöllner

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

05 |
0:00:00 Start
0:08:20 Gesetz der Auswirkung
0:10:33 Lernen durch Belohnung/Bestrafung
0:12:06 Einordnung von Reinforcement Lerning
0:21:53 Reinforcement Lerning(RL)
0:27:04 Lernziel Reinforcement Lerning
0:30:18 Markov Decision Process(deterministisch)
0:43:10 Monte Carlo Methoden(MC)
0:47:14 Strategielernen - Policy learning
0:50:33 Optimale Strategie
0:52:16 Temporal-Difference Learning(TD)
0:54:39 Bootstrapping und Sampling
0:56:40 Taxonomie des Reinforcement Learning
0:57:59 Simple Temporal Difference Learning I (Simple Value Iteration)
1:03:58 Problemdimensionen beim RL
1:07:04 Die Q-Funktion
1:09:04 Q-Lernen Algorithmus
1:10:38 Suchstrategien / Experimentieren
1:11:16 Exploration vs. Exploitation
1:12:31 Optimierung
1:15:24 Repräsentation, Generalisierung
1:15:43 Nichtdeterministischer MDP
1:18:04 On-Policy Learning / Off-Policy Learning
1:19:14 Lernen von Aktionssequenzen
1:20:37 Eligibility Traces
1:21:05 SARSA-Algorithmus mit Eligibility Traces
1:21:29 Fahrstuhlsteuerung mit RL
1:22:17 TD - Gammon
1:23:12 BISAM

Laufzeit (hh:mm:ss)

01:24:34

Serie

Maschinelles Lernen 1 - Grundverfahren, WS 2018/19

Publiziert am

27.11.2018

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 128000 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 934439 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5074 s
Dateiname DIVA-2018-900_hd.mp4
Dateigröße 592.708.371 byte
Bildwiederholfrequenz 25
Videobitrate 800344 kbps
Video Codec h264

Embed-Code