KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 08.02.2016, Vorlesung 22

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

22: Vorlesung |
0:00:00 Starten
0:00:43 Adaption
0:08:52 Motivation
0:13:40 Adaption des Akustischen Modells
0:16:21 Mögliche Variationen
0:18:24 Adaption als Transformation
0:22:51 Arten der Adaption
0:27:13 Batch vs. Inkrementell
0:31:17 Überwachte und Unüberwachte Adaption
0:32:18 Training vs. Normalisierung
0:33:07 Merkmals vs. Modelladaption
0:36:23 Anwendung der Transformation
0:37:27 Optimierungskriterien zur Schätzung
0:39:40 Adaptionsmethoden
0:42:43 Vokaltraktlängen-normalisierung (VTLN)
0:52:39 VTLN: Experimente
0:58:53 Inkrementelle Adaption
1:05:06 Verschiedenes zu VTLN
1:08:48 MAP Adaption
1:14:37 Maximum Likelihood Linear Regression (MLLR)
1:17:54 Finden von Klassen
1:20:11 Label Boosting mit MLLR
1:21:48 Welche Adaption unter welchen Bedingungen
1:23:14 fMLLR

Laufzeit (hh:mm:ss)

01:25:36

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

08.02.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 110679 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 916602 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5136 s
Dateiname DIVA-2016-162_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799828 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22