KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 14.12.2016, 15

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

15 |
0:00:00 Starten
0:00:05 Aussprachewörterbücher, Sprachmodelle
0:00:41 Flexibles Trainingsalignment
0:01:05 Aussprachen bestimmen für unüberwachtes Lernen
0:05:18 Emotionserkennung mit Hilfe von Aussprachenvarianten
0:06:27 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)
0:09:10 Multiworte
0:12:05 Single Pronunciation Dictionaries
0:15:06 Erweiterter Clusterbaum
0:18:48 Ergebnisse
0:22:47 Literaturempfehlung
0:23:27 Sprachmodellierung
0:24:15 Erinnerung: Fundamentalformel
0:29:44 Determinstische vs. Stochastische Sprachmodelle
0:33:48 Wörterratespiel
0:38:08 Wozu dient das Sprachmodell
0:40:26 Stochastische Sprachmodelle
0:44:57 Äquivalenzklassen
0:46:28 Schätzen von N-Gramm W´keiten
0:47:34 Beispiel
0:50:57 Bigramme und Trigramme
0:53:57 Das Bag-of-Words Experiment
0:55:30 Glättung von Sprachmodellparametern
0:57:59 Discounting
1:00:51 Interpolation (Lineare Glättung)
1:02:16 HMM für Interpolationsgewichte
1:10:10 Schätzung der Gewichte
1:10:57 HMM für Interpolationsgewichte
1:11:53 Deleted Interpolation. Basierend auf den »Conditional Counts«
1:17:47 Praktische Aspekte
1:19:38 Schätzen von Y
1:20:28 Allgemeines Rahmenwerk für Glättung
1:22:41 Weitere Notationen

Laufzeit (hh:mm:ss)

01:23:10

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

20.12.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 112180 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 917060 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4990 s
Dateiname DIVA-2016-828_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 798786 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19