KIT-Bibliothek

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 06.02.2017, 19

Author

Sebastian Stüker

Editor

KIT | Webcast

Participating institute

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Description

0:00:00 Starten
0:00:16 Minimierung des Wortfehlers
0:02:50 Approximierung mit N-besten Listen
0:04:06 WER Minimierung auf Wortgraphen
0:04:18 Multiple Alignment WER
0:07:03 Finden des globalen Alignment
0:08:21 Alignment als Äquivalenzrelation
0:09:44 Finden einer angemessenen Äquivalenzrelation
0:12:02 Intra-Wort-Clustern
0:14:58 Pruning
0:15:45 Confusionsnetzwerke
0:18:20 Confusionsnetzwer-Hypothese
0:19:20 Eyperimente
0:23:03 Systemkombination
0:25:00 Systemkombination mit ROVER
0:28:33 Alignierung vieler Hypothesen mittlels DP
0:29:30 Beispiel
0:30:46 Mehrheitsentscheidung
0:31:25 Experimente
0:34:28 Probleme mit EM Training
0:38:06 Korrektives Training
0:41:22 Diskriminatives Training
0:43:00 Maximierung der Posterioriw'keit
0:43:41 Transformation / Mutual Information
0:45:14 Maximum Mutual Information Estimation (MMIE)
0:47:52 MLE vs. MMIE
0:50:35 MMIE Implementierung
0:51:20 MMIE Optimierung
0:52:16 Erweiterte Baum-Welch Regeln
0:54:59 MMIE Trainingsprozedur
0:57:21 Ergebnisse
0:58:00 MWE/MCE Training
1:07:31 Neue-Worte-Problem
1:09:31 Ansätze
1:11:02 Häufigkeitsverteilung von Wörtern
1:12:46 Herausvorderungen bei der OOV Detektion
1:14:11 OOV Wörtermodelle im AM
1:15:37 AM
1:16:03 OOV Wörtermodelle LM
1:17:49 Automatisches Clustern
1:18:06 Beispiele
1:19:36 Genauigkeit OOV Detektion
1:21:01 Lernen der neuen Wörter
1:21:32 Beispiel Lerndialog

Duration (hh:mm:ss)

01:23:35

Series

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Published on

16.02.2017

Subject area

Computer science

License

KITopen Licence

Resolution 1280 x 720 Pixel
Aspect ratio 16:9
Audio bitrate 108113 bps
Audio channels 2
Audio Codec aac
Audio Sample Rate 48000 Hz
Total Bitrate 912771 bps
Color Space yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Media Type video/mp4
Duration 5015 s
Filename DIVA-2017-116_hd.mp4
File Size 4.096 byte
Frame Rate 25
Video Bitrate 798562 bps
Video Codec h264

Media URL

Embed Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Episodes 1-19 of 19