Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 09.11.2015, Vorlesung 07
Autor
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
07: Vorlesung |
0:00:00 Starten
0:00:06 Vorverarbeitung Teil 2
0:01:19 Quantisierung
0:04:25 Quantisierungsrauschen
0:08:53 Quantisierung von Sprachsignalen
0:11:14 Einseitige und zweiseitige Laplace Transformation
0:14:03 Laplace Transformation
0:15:57 F(s)-Darstellung
0:18:48 Wiederholung LTI-Systeme
0:20:03 Darstellung der Übertragungsfunktion von LTI-Systemen
0:20:35 Darstellung der Übertragunsfunktion von LTI-Systemen im Laplace-Bereich
0:24:28 Projektion auf s-Ebene
0:25:33 Pol-Nullstellen-Schema in der s-Ebene
0:26:50 Projektion auf s-Ebene
0:29:38 Z-Transformation
0:33:14 Zusammenhang LT und ZT
0:33:59 Abbildung komplexe s-Ebene auf z-Ebene
0:34:34 Kurzzeitspektralanalyse
0:44:41 Periodizität des gefensterten Signals
0:48:25 Effekt der Fensterung
0:51:18 Fensterfunktionen
0:56:31 Wo ist der Fehler?
0:57:55 Spektrogramm
1:01:58 Oberschwingung, Harmonische
1:05:12 Spektrogramm
1:06:59 Mel Skalierung
1:09:47 Mel Skala
1:10:52 Mel Skalierung
1:12:48 Effekt der Fensterlängen
Laufzeit (hh:mm:ss)
01:25:18
Serie
Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Publiziert am
17.11.2015
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 117060 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 923114 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5118 s |
Dateiname | DIVA-2015-775_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 799964 bps |
Video Codec | h264 |
Embed-Code