KIT-Bibliothek

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 09.11.2015, Vorlesung 07

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:06 Vorverarbeitung Teil 2
  • 0:01:19 Quantisierung
  • 0:04:25 Quantisierungsrauschen
  • 0:08:53 Quantisierung von Sprachsignalen
  • 0:11:14 Einseitige und zweiseitige Laplace Transformation
  • 0:14:03 Laplace Transformation
  • 0:15:57 F(s)-Darstellung
  • 0:18:48 Wiederholung LTI-Systeme
  • 0:20:03 Darstellung der Übertragungsfunktion von LTI-Systemen
  • 0:20:35 Darstellung der Übertragunsfunktion von LTI-Systemen im Laplace-Bereich
  • 0:24:28 Projektion auf s-Ebene
  • 0:25:33 Pol-Nullstellen-Schema in der s-Ebene
  • 0:26:50 Projektion auf s-Ebene
  • 0:29:38 Z-Transformation
  • 0:33:14 Zusammenhang LT und ZT
  • 0:33:59 Abbildung komplexe s-Ebene auf z-Ebene
  • 0:34:34 Kurzzeitspektralanalyse
  • 0:44:41 Periodizität des gefensterten Signals
  • 0:48:25 Effekt der Fensterung
  • 0:51:18 Fensterfunktionen
  • 0:56:31 Wo ist der Fehler?
  • 0:57:55 Spektrogramm
  • 1:01:58 Oberschwingung, Harmonische
  • 1:05:12 Spektrogramm
  • 1:06:59 Mel Skalierung
  • 1:09:47 Mel Skala
  • 1:10:52 Mel Skalierung
  • 1:12:48 Effekt der Fensterlängen

Laufzeit (hh:mm:ss)

01:25:18

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

17.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 117060 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 923114 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5118 s
Dateiname DIVA-2015-775_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799964 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22