KIT-Bibliothek

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 11.01.2016, Vorlesung 15

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:05:06 Fehler durch falsche Aussprachen
  • 0:08:07 Generierung von Aussprachewörterbüchern
  • 0:11:32 Verwendung von existierenden Wörterbüchern
  • 0:18:46 Lernen von Ausspracheregeln
  • 0:28:21 Inkrementelles Lernen
  • 0:30:07 Aussprachevarianten
  • 0:33:21 Finden von Aussprachevarianten
  • 0:35:28 Probleme mit Aussprachevarianten
  • 0:39:45 Typische Aussprachevarianten
  • 0:40:16 Regeln für Aussprachevarianten im Deutschen
  • 0:41:31 Datengetriebenes finden von Aussprachevarianten
  • 0:42:51 Finden von Aussprachevarianten mit dem Silbenmodell
  • 0:44:04 Flexibles Trainingsalignment
  • 0:45:45 Aussprachen bestimmen für unüberwachtes Lernen
  • 0:47:27 Emotionserkennung mit Hilfe von Aussprachevarianten
  • 0:49:22 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)
  • 0:51:23 Multiworte
  • 0:53:56 Single Pronunciation Dictionaries
  • 0:56:00 Erweiterter Clusterbaum
  • 0:56:06 Ergebnisse
  • 1:01:07 Literaturempfehlung
  • 1:01:51 Sprachmodellierung
  • 1:02:04 Erinnerung: Fundamentalformel
  • 1:02:34 Deterministische vs. Stochastische Sprachmodelle
  • 1:04:57 Wörterratespiel
  • 1:08:46 Wozu dient das Sprachmodell
  • 1:11:12 Stochastische Sprachmodelle
  • 1:16:40 Äquivalenzklassen
  • 1:19:00 Schätzen von N-Gramm W`keiten
  • 1:19:53 Beispiel

Laufzeit (hh:mm:ss)

01:22:54

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

14.01.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 106671 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 912656 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4974 s
Dateiname DIVA-2016-46_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799890 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22