KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 02.11.2016, 06

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

06 |
0:00:00 Starten
0:00:15 Zusammenfassung Fouriertransformation
0:02:21 Digitalisierung
0:03:02 Abtastung (Sampling)
0:04:21 Abtasttheorem Nyquist-Shannon Theorem
0:06:36 Aliasing
0:18:46 Reale Abtastung
0:20:19 Quantisierung
0:23:35 Quantisierungsrauschen
0:27:58 Quantisierung von Sprachsignalen
0:30:20 Einseiztige und zweiseitige Laplace Transformation
0:34:51 Laplace Transformation
0:36:16 |F(s)| - Darstellung
0:37:29 Wiederholung LTI-Systeme
0:38:48 Darstellung der Übertragungsfunktion von LTI Systemen
0:44:58 Projektion auf s-Ebene
0:46:23 Pol-Nullstellen-Schema in der s-Ebene
0:47:03 Z-Transformation
0:48:50 Zusammenhang LT und ZT
0:49:43 Abbildung komplexe s-Ebene auf z-Ebene
0:51:20 Kurzzeitspektralanalyse
1:01:51 Periodizität des gefensterten Signals
1:05:04 Effekt der Fensterung
1:06:54 Fensterfunktionen (1)
1:09:48 Effekt der Fensterung
1:11:32 Fensterfunktionen (2)
1:14:06 Wo ist der Fehler?
1:14:27 Spektogramm (1)
1:17:34 Oberschwingung, Harmonische
1:21:18 Spektogramm (2)
1:26:36 Fensterfunktionen (3)
1:28:32 Spektogramm (3)

Laufzeit (hh:mm:ss)

01:29:22

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

10.11.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 107541 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 913392 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5362 s
Dateiname DIVA-2016-700_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799757 bps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19