KIT-Bibliothek

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 14.12.2016, 15

Author

Sebastian Stüker

Editor

KIT | Webcast

Participating institute

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Description

  • 0:00:00 Starten
  • 0:00:05 Aussprachewörterbücher, Sprachmodelle
  • 0:00:41 Flexibles Trainingsalignment
  • 0:01:05 Aussprachen bestimmen für unüberwachtes Lernen
  • 0:05:18 Emotionserkennung mit Hilfe von Aussprachenvarianten
  • 0:06:27 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)
  • 0:09:10 Multiworte
  • 0:12:05 Single Pronunciation Dictionaries
  • 0:15:06 Erweiterter Clusterbaum
  • 0:18:48 Ergebnisse
  • 0:22:47 Literaturempfehlung
  • 0:23:27 Sprachmodellierung
  • 0:24:15 Erinnerung: Fundamentalformel
  • 0:29:44 Determinstische vs. Stochastische Sprachmodelle
  • 0:33:48 Wörterratespiel
  • 0:38:08 Wozu dient das Sprachmodell
  • 0:40:26 Stochastische Sprachmodelle
  • 0:44:57 Äquivalenzklassen
  • 0:46:28 Schätzen von N-Gramm W´keiten
  • 0:47:34 Beispiel
  • 0:50:57 Bigramme und Trigramme
  • 0:53:57 Das Bag-of-Words Experiment
  • 0:55:30 Glättung von Sprachmodellparametern
  • 0:57:59 Discounting
  • 1:00:51 Interpolation (Lineare Glättung)
  • 1:02:16 HMM für Interpolationsgewichte
  • 1:10:10 Schätzung der Gewichte
  • 1:10:57 HMM für Interpolationsgewichte
  • 1:11:53 Deleted Interpolation. Basierend auf den »Conditional Counts«
  • 1:17:47 Praktische Aspekte
  • 1:19:38 Schätzen von Y
  • 1:20:28 Allgemeines Rahmenwerk für Glättung
  • 1:22:41 Weitere Notationen

Duration (hh:mm:ss)

01:23:10

Series

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Published on

20.12.2016

Subject area

Computer science

License

KITopen Licence

Resolution 1280 x 720 Pixel
Aspect ratio 16:9
Audio bitrate 112180 bps
Audio channels 2
Audio Codec aac
Audio Sample Rate 48000 Hz
Total Bitrate 917060 bps
Color Space yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Media Type video/mp4
Duration 4990 s
Filename DIVA-2016-828_hd.mp4
File Size 4.096 byte
Frame Rate 25
Video Bitrate 798786 bps
Video Codec h264

Media URL

Embed Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Episodes 1-19 of 19