23: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 07.02.2018
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:52 Inkrementelle Adaption
- 0:03:12 Verschiedenes zu VTLN
- 0:09:00 Maximum Likelihood Linear Regression (MLLR)
- 0:18:25 Welche Adaption unter welchen Bedingungen?
- 0:21:27 Erinnerung MLLR
- 0:28:39 Bottleneck Features
- 0:33:48 Acoustic Model: Neural networks
- 0:41:07 Time-delay neural networks (TDNN)
- 0:47:31 Speaker adaptive neural networks
- 0:55:34 Neural network training: Potential problems?
- 1:05:53 Connectionist temporal classification (CTC)
- 1:23:21 Reaching "human parity"
Laufzeit (hh:mm:ss)
01:32:33
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Publiziert am
08.02.2018
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 128000 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 915340 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5553 s |
Dateiname | DIVA-2018-167_hd.mp4 |
Dateigröße | 635.358.027 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 781243 bps |
Video Codec | h264 |
Mediathek-URL
Embed-Code
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Folgen 1-23
von 23