KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 18.01.2016, Vorlesung 17

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:13 Kurze Wiederholung der letzten Vorlesung
  • 0:04:16 Kneser-Ney Backoff
  • 0:08:07 Schätzung von Beta - Margnialisierung
  • 0:16:51 Leaving-One-Out Beta Schätzung
  • 0:19:04 Ergebnisse von Kneser-Ney
  • 0:20:27 Qualität von Sprachmodellen
  • 0:23:21 Entropie einer Wortquelle
  • 0:26:29 Perplexität von Sprachmodellen
  • 0:35:16 Perplexität und Akustik
  • 0:38:02 Klassenbasierte Sprachmodelle
  • 0:44:08 Aussprachevarianten
  • 0:45:58 Multiworte
  • 0:47:59 Besondere Arten von Sprachmodellen
  • 0:48:44 Interpolierte Sprachmodelle
  • 0:53:56 Cache Sprachmodelle
  • 0:57:49 Trigger Sprachmodelle
  • 1:00:06 Mehrschichtige Sprachmodelle
  • 1:01:56 Verzahnte Sprachmodelle
  • 1:04:26 Morphembasierte Sprachmodelle
  • 1:10:31 Entscheidungsbäume
  • 1:12:02 HMMs für Modellierung
  • 1:13:57 Probleme mit Spontaner Sprache
  • 1:18:11 Probleme mit unbekannten Wörtern
  • 1:20:34 Besonderheiten verschiedener Sprachen

Laufzeit (hh:mm:ss)

01:23:48

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

19.01.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 106473 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 912361 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5028 s
Dateiname DIVA-2016-92_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799796 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22