Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 14.12.2016, 15
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
15 |
0:00:00 Starten
0:00:05 Aussprachewörterbücher, Sprachmodelle
0:00:41 Flexibles Trainingsalignment
0:01:05 Aussprachen bestimmen für unüberwachtes Lernen
0:05:18 Emotionserkennung mit Hilfe von Aussprachenvarianten
0:06:27 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)
0:09:10 Multiworte
0:12:05 Single Pronunciation Dictionaries
0:15:06 Erweiterter Clusterbaum
0:18:48 Ergebnisse
0:22:47 Literaturempfehlung
0:23:27 Sprachmodellierung
0:24:15 Erinnerung: Fundamentalformel
0:29:44 Determinstische vs. Stochastische Sprachmodelle
0:33:48 Wörterratespiel
0:38:08 Wozu dient das Sprachmodell
0:40:26 Stochastische Sprachmodelle
0:44:57 Äquivalenzklassen
0:46:28 Schätzen von N-Gramm W´keiten
0:47:34 Beispiel
0:50:57 Bigramme und Trigramme
0:53:57 Das Bag-of-Words Experiment
0:55:30 Glättung von Sprachmodellparametern
0:57:59 Discounting
1:00:51 Interpolation (Lineare Glättung)
1:02:16 HMM für Interpolationsgewichte
1:10:10 Schätzung der Gewichte
1:10:57 HMM für Interpolationsgewichte
1:11:53 Deleted Interpolation. Basierend auf den »Conditional Counts«
1:17:47 Praktische Aspekte
1:19:38 Schätzen von Y
1:20:28 Allgemeines Rahmenwerk für Glättung
1:22:41 Weitere Notationen
Laufzeit (hh:mm:ss)
01:23:10
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17
Publiziert am
20.12.2016
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 112180 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 917060 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 4990 s |
Dateiname | DIVA-2016-828_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 798786 bps |
Video Codec | h264 |
Embed-Code