
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 09.11.2016, 07
Author
Editor
Participating institute
Institut für Anthropomatik und Robotik (IAR)
Genre
Description
- 0:00:00 Starten
- 0:00:17 Spektrogramm
- 0:00:58 Oberschwingung, Harmonische
- 0:03:14 Mel Skalierung
- 0:07:18 Effekt der Fensterlänge
- 0:12:44 Quelle Filter Modell der Sprache
- 0:15:24 Helmholtzresonator
- 0:17:08 Vokaldreieck
- 0:21:30 Lineare Vorhersage (LPC)
- 0:28:54 Interpretation der LPC Koeffizienten
- 0:30:47 All-Pole Modell
- 0:30:53 LPC Beispiel
- 0:33:45 Cepstrum
- 0:50:02 Diskrete Cosinustransformation
- 0:51:03 Beispiel: Berechnung MFCC Koeffizienten
- 0:51:35 Filterbank im Leistungsbetrags-Spektrum
- 0:51:52 Mel-Filterbank
- 0:51:59 Logarithmus auf Leistungsbetragsspektrum
- 0:52:31 Cepstral-Koeffizienten
- 0:53:17 Log-Spektrum rekonstruiert von (geliftertem) Cepstrum
- 0:53:35 Vergleich Verschiedener Spektren
- 0:54:34 Typische Vorverarbeitung
- 1:05:14 Spektrogramm
- 1:05:48 Dynamische Merkmale
- 1:07:36 Autokorrelation
- 1:12:57 Nulldurchgangsrate
- 1:15:36 Hauptkomponentenanalyse (PCA)
- 1:24:51 Lineare Diskriminanzanalyse
Duration (hh:mm:ss)
01:25:20
Series
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17
Published on
21.11.2016
Subject area
License
Resolution | 1280 x 720 Pixel |
Aspect ratio | 16:9 |
Audio bitrate | 101255 bps |
Audio channels | 2 |
Audio Codec | aac |
Audio Sample Rate | 48000 Hz |
Total Bitrate | 907188 bps |
Color Space | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Media Type | video/mp4 |
Duration | 5120 s |
Filename | DIVA-2016-732_hd.mp4 |
File Size | 4.096 byte |
Frame Rate | 25 |
Video Bitrate | 799840 bps |
Video Codec | h264 |
Media URL
Embed Code
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17
Episodes 1-19
of 19