KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

07: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 15.11.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

07 |
0:00:00 Starten
0:00:04 Spektrodiagramm
0:03:22 Oberschwingung, Harmonische
0:07:11 Mel Skalierung
0:16:35 Effekt der Fensterlängen
0:20:58 Quelle Filter Modell der Sprache
0:22:36 Helmholtzresonator
0:27:55 Vokaldreieck
0:32:59 Lineare Vorhersage (LPC)
0:42:42 Interpretation der LPC Koeffizienten
0:45:59 All-Pole Modell
0:46:54 LPC Beispiel
0:49:28 Cepstrum
1:06:13 Diskrete Cosinustransformation
1:13:32 Beispiel: Berechnung MFCC Koeffizienten
1:15:29 Cepstral-Koeffizienten

Laufzeit (hh:mm:ss)

01:18:53

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

17.11.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 99710 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 904916 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4733 s
Dateiname DIVA-2017-650_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799116 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23