KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 14.12.2016, 15

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:05 Aussprachewörterbücher, Sprachmodelle
  • 0:00:41 Flexibles Trainingsalignment
  • 0:01:05 Aussprachen bestimmen für unüberwachtes Lernen
  • 0:05:18 Emotionserkennung mit Hilfe von Aussprachenvarianten
  • 0:06:27 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)
  • 0:09:10 Multiworte
  • 0:12:05 Single Pronunciation Dictionaries
  • 0:15:06 Erweiterter Clusterbaum
  • 0:18:48 Ergebnisse
  • 0:22:47 Literaturempfehlung
  • 0:23:27 Sprachmodellierung
  • 0:24:15 Erinnerung: Fundamentalformel
  • 0:29:44 Determinstische vs. Stochastische Sprachmodelle
  • 0:33:48 Wörterratespiel
  • 0:38:08 Wozu dient das Sprachmodell
  • 0:40:26 Stochastische Sprachmodelle
  • 0:44:57 Äquivalenzklassen
  • 0:46:28 Schätzen von N-Gramm W´keiten
  • 0:47:34 Beispiel
  • 0:50:57 Bigramme und Trigramme
  • 0:53:57 Das Bag-of-Words Experiment
  • 0:55:30 Glättung von Sprachmodellparametern
  • 0:57:59 Discounting
  • 1:00:51 Interpolation (Lineare Glättung)
  • 1:02:16 HMM für Interpolationsgewichte
  • 1:10:10 Schätzung der Gewichte
  • 1:10:57 HMM für Interpolationsgewichte
  • 1:11:53 Deleted Interpolation. Basierend auf den »Conditional Counts«
  • 1:17:47 Praktische Aspekte
  • 1:19:38 Schätzen von Y
  • 1:20:28 Allgemeines Rahmenwerk für Glättung
  • 1:22:41 Weitere Notationen

Laufzeit (hh:mm:ss)

01:23:10

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

20.12.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 112180 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 917060 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4990 s
Dateiname DIVA-2016-828_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 798786 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19