KIT-Bibliothek

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 11.11.2015, Vorlesung 08

Author

Sebastian Stüker

Participating institute

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Description

  • 0:00:00 Starten
  • 0:00:24 Wiederholung: Laplace Transformation, Kurzzeitspektralanalyse
  • 0:06:06 Quelle Filter Modell der Sprache
  • 0:07:40 Helmholtzresonator
  • 0:12:25 Vokaldreieck
  • 0:18:34 Lineare Vorhersage (LPC)
  • 0:26:46 Interpretation der LPC Koeffizienten
  • 0:29:04 All-Pole Modell
  • 0:30:16 LPC Beispiel
  • 0:35:33 Cesptrum
  • 0:51:39 Diskrete Cosinustransformation
  • 0:59:11 Beispiel: Berechnung MFCC Koeffizienten
  • 1:00:02 Filterbank im Leistungsbetrags-Spektrum (Mel-Filterbank)
  • 1:00:41 Logarithmus auf Leistungsbetragsspektrum
  • 1:01:29 Cepstral-Koeffizienten
  • 1:03:19 Log-Spektrum rekonstruiert von (geliftertem) Cepstrum
  • 1:03:44 Vergleich Verschiedener Spektren
  • 1:04:21 Typische Vorverarbeitung
  • 1:13:00 Dynamische Merkmale
  • 1:14:10 Autokorrelation
  • 1:21:18 Nulldurchgangsrate
  • 1:23:15 Hauptkomponentenanalyse (PCA)

Duration (hh:mm:ss)

01:23:50

Series

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Published on

17.11.2015

Subject area

Computer science

License

KITopen Licence

Resolution 1280 x 720 Pixel
Aspect ratio 16:9
Audio bitrate 107407 bps
Audio channels 2
Audio Codec aac
Audio Sample Rate 48000 Hz
Total Bitrate 913306 bps
Color Space yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Media Type video/mp4
Duration 5030 s
Filename DIVA-2015-776_hd.mp4
File Size 4.096 byte
Frame Rate 25
Video Bitrate 799805 bps
Video Codec h264

Media URL

Embed Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Episodes 1-22 of 22