KIT-Bibliothek
Audio-/Videodatei publizieren

06: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 13.11.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

06 |
0:00:00 Starten
0:00:19 Die heutige Vorlesung
0:00:27 Darstellungen der Fourierreihe
0:00:37 Fouriertransformation
0:01:17 Komplexes Spektrum
0:03:06 Projektion der komplexen Exponentialfunktion auf die reelle trigonometrische Funktion
0:04:33 Zeitdiskrete Fouriertransformation
0:07:37 Diskrete Fouriertransformation
0:11:11 Schnelle Fouriertransformation
0:12:44 Zusammenfassung Fouriertransformation
0:14:25 Digitalisierung
0:15:26 Abtastung (Sampling)
0:17:29 Abtasttheorem
0:20:34 Aliasing
0:30:05 Reale Abtastung
0:32:11 Quantisierung
0:33:49 Quantisierungsrauschen
0:38:21 Quantisierung von Sprachsignalen
0:41:27 Einseitige und zweiseitige Laplace Transformation
0:46:34 Wiederholung LTI-Systeme
0:47:40 Darstellung der Übertragungsfunktion von LTI Systemen
0:52:07 Projektion auf s-Ebene
0:54:28 Pol-Nullstellen-Schema in der s-Ebene
0:54:40 Die Z-Transformation
0:55:43 Zusammenhang LT und ZT
0:58:32 Abbildung komplexe s-Ebene auf z-Ebene
1:00:47 Kurzzeitspektralanalyse
1:10:46 Periodizität des gefensterten Signals
1:11:00 Effekt der Fensterung
1:12:58 Fensterfunktionen
1:18:05 Spektrogramm

Laufzeit (hh:mm:ss)

01:20:54

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

16.11.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 102232 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 907438 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4854 s
Dateiname DIVA-2017-630_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799112 bps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23