KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 09.11.2015, Vorlesung 07

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

07: Vorlesung |
0:00:00 Starten
0:00:06 Vorverarbeitung Teil 2
0:01:19 Quantisierung
0:04:25 Quantisierungsrauschen
0:08:53 Quantisierung von Sprachsignalen
0:11:14 Einseitige und zweiseitige Laplace Transformation
0:14:03 Laplace Transformation
0:15:57 F(s)-Darstellung
0:18:48 Wiederholung LTI-Systeme
0:20:03 Darstellung der Übertragungsfunktion von LTI-Systemen
0:20:35 Darstellung der Übertragunsfunktion von LTI-Systemen im Laplace-Bereich
0:24:28 Projektion auf s-Ebene
0:25:33 Pol-Nullstellen-Schema in der s-Ebene
0:26:50 Projektion auf s-Ebene
0:29:38 Z-Transformation
0:33:14 Zusammenhang LT und ZT
0:33:59 Abbildung komplexe s-Ebene auf z-Ebene
0:34:34 Kurzzeitspektralanalyse
0:44:41 Periodizität des gefensterten Signals
0:48:25 Effekt der Fensterung
0:51:18 Fensterfunktionen
0:56:31 Wo ist der Fehler?
0:57:55 Spektrogramm
1:01:58 Oberschwingung, Harmonische
1:05:12 Spektrogramm
1:06:59 Mel Skalierung
1:09:47 Mel Skala
1:10:52 Mel Skalierung
1:12:48 Effekt der Fensterlängen

Laufzeit (hh:mm:ss)

01:25:18

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

17.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 117060 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 923114 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5118 s
Dateiname DIVA-2015-775_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799964 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22