KIT-Bibliothek
Audio-/Videodatei publizieren

22: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 05.02.2018

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:15 Qualität von Sprachmodellen
  • 0:04:22 Entropie einer Wortquelle
  • 0:09:36 Perplexität von Sprachmodellen
  • 0:17:42 Perpkexität und Akustik
  • 0:21:51 Adaption - Motivation
  • 0:30:51 Adaption des Akustischen Modells
  • 0:38:46 Adaption als Transformation
  • 0:40:45 Arten der Adaption
  • 0:50:50 Anweundung der Transformation
  • 0:54:11 Adaptionsmethoden
  • 0:56:06 Vokaltraktlängen- normalisierung (VTLN)
  • 1:11:27 VTLN: Experimente

Laufzeit (hh:mm:ss)

01:20:26

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

06.02.2018

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 128000 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 752990 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4826 s
Dateiname DIVA-2018-157_hd.mp4
Dateigröße 454.209.612 byte
Bildwiederholfrequenz 25
Videobitrate 618892 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23