KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 08.02.2016, Vorlesung 22

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:43 Adaption
  • 0:08:52 Motivation
  • 0:13:40 Adaption des Akustischen Modells
  • 0:16:21 Mögliche Variationen
  • 0:18:24 Adaption als Transformation
  • 0:22:51 Arten der Adaption
  • 0:27:13 Batch vs. Inkrementell
  • 0:31:17 Überwachte und Unüberwachte Adaption
  • 0:32:18 Training vs. Normalisierung
  • 0:33:07 Merkmals vs. Modelladaption
  • 0:36:23 Anwendung der Transformation
  • 0:37:27 Optimierungskriterien zur Schätzung
  • 0:39:40 Adaptionsmethoden
  • 0:42:43 Vokaltraktlängen-normalisierung (VTLN)
  • 0:52:39 VTLN: Experimente
  • 0:58:53 Inkrementelle Adaption
  • 1:05:06 Verschiedenes zu VTLN
  • 1:08:48 MAP Adaption
  • 1:14:37 Maximum Likelihood Linear Regression (MLLR)
  • 1:17:54 Finden von Klassen
  • 1:20:11 Label Boosting mit MLLR
  • 1:21:48 Welche Adaption unter welchen Bedingungen
  • 1:23:14 fMLLR

Laufzeit (hh:mm:ss)

01:25:36

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

08.02.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 110679 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 916602 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5136 s
Dateiname DIVA-2016-162_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799828 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22