Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 08.02.2016, Vorlesung 22
Autor
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
22: Vorlesung |
0:00:00 Starten
0:00:43 Adaption
0:08:52 Motivation
0:13:40 Adaption des Akustischen Modells
0:16:21 Mögliche Variationen
0:18:24 Adaption als Transformation
0:22:51 Arten der Adaption
0:27:13 Batch vs. Inkrementell
0:31:17 Überwachte und Unüberwachte Adaption
0:32:18 Training vs. Normalisierung
0:33:07 Merkmals vs. Modelladaption
0:36:23 Anwendung der Transformation
0:37:27 Optimierungskriterien zur Schätzung
0:39:40 Adaptionsmethoden
0:42:43 Vokaltraktlängen-normalisierung (VTLN)
0:52:39 VTLN: Experimente
0:58:53 Inkrementelle Adaption
1:05:06 Verschiedenes zu VTLN
1:08:48 MAP Adaption
1:14:37 Maximum Likelihood Linear Regression (MLLR)
1:17:54 Finden von Klassen
1:20:11 Label Boosting mit MLLR
1:21:48 Welche Adaption unter welchen Bedingungen
1:23:14 fMLLR
Laufzeit (hh:mm:ss)
01:25:36
Serie
Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Publiziert am
08.02.2016
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 110679 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 916602 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5136 s |
Dateiname | DIVA-2016-162_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 799828 bps |
Video Codec | h264 |
Embed-Code