KIT-Bibliothek
Audio-/Videodatei publizieren

23: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 07.02.2018

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

23 |
0:00:00 Starten
0:00:52 Inkrementelle Adaption
0:03:12 Verschiedenes zu VTLN
0:09:00 Maximum Likelihood Linear Regression (MLLR)
0:18:25 Welche Adaption unter welchen Bedingungen?
0:21:27 Erinnerung MLLR
0:28:39 Bottleneck Features
0:33:48 Acoustic Model: Neural networks
0:41:07 Time-delay neural networks (TDNN)
0:47:31 Speaker adaptive neural networks
0:55:34 Neural network training: Potential problems?
1:05:53 Connectionist temporal classification (CTC)
1:23:21 Reaching "human parity"

Laufzeit (hh:mm:ss)

01:32:33

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

08.02.2018

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 128000 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 915340 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5553 s
Dateiname DIVA-2018-167_hd.mp4
Dateigröße 635.358.027 byte
Bildwiederholfrequenz 25
Videobitrate 781243 bps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23