FAQ
Audio-/Videodatei publizieren
23: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 07.02.2018
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:52 Inkrementelle Adaption
- 0:03:12 Verschiedenes zu VTLN
- 0:09:00 Maximum Likelihood Linear Regression (MLLR)
- 0:18:25 Welche Adaption unter welchen Bedingungen?
- 0:21:27 Erinnerung MLLR
- 0:28:39 Bottleneck Features
- 0:33:48 Acoustic Model: Neural networks
- 0:41:07 Time-delay neural networks (TDNN)
- 0:47:31 Speaker adaptive neural networks
- 0:55:34 Neural network training: Potential problems?
- 1:05:53 Connectionist temporal classification (CTC)
- 1:23:21 Reaching "human parity"
Laufzeit (hh:mm:ss)
01:32:33
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Publiziert am
08.02.2018
Fachgebiet
Lizenz
| Auflösung | 1280 x 720 Pixel |
| Seitenverhältnis | 16:9 |
| Audiobitrate | 128000 bps |
| Audio Kanäle | 2 |
| Audio Codec | aac |
| Audio Abtastrate | 48000 Hz |
| Gesamtbitrate | 915340 bps |
| Farbraum | yuv420p |
| Container | mov,mp4,m4a,3gp,3g2,mj2 |
| Medientyp | video/mp4 |
| Dauer | 5553 s |
| Dateiname | DIVA-2018-167_hd.mp4 |
| Dateigröße | 635.358.027 byte |
| Bildwiederholfrequenz | 25 |
| Videobitrate | 781243 bps |
| Video Codec | h264 |
Mediathek-URL
Embed-Code
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Folgen 1-23
von 23