Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 06.02.2017, 19
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
0:00:00 Starten
0:00:16 Minimierung des Wortfehlers
0:02:50 Approximierung mit N-besten Listen
0:04:06 WER Minimierung auf Wortgraphen
0:04:18 Multiple Alignment WER
0:07:03 Finden des globalen Alignment
0:08:21 Alignment als Äquivalenzrelation
0:09:44 Finden einer angemessenen Äquivalenzrelation
0:12:02 Intra-Wort-Clustern
0:14:58 Pruning
0:15:45 Confusionsnetzwerke
0:18:20 Confusionsnetzwer-Hypothese
0:19:20 Eyperimente
0:23:03 Systemkombination
0:25:00 Systemkombination mit ROVER
0:28:33 Alignierung vieler Hypothesen mittlels DP
0:29:30 Beispiel
0:30:46 Mehrheitsentscheidung
0:31:25 Experimente
0:34:28 Probleme mit EM Training
0:38:06 Korrektives Training
0:41:22 Diskriminatives Training
0:43:00 Maximierung der Posterioriw'keit
0:43:41 Transformation / Mutual Information
0:45:14 Maximum Mutual Information Estimation (MMIE)
0:47:52 MLE vs. MMIE
0:50:35 MMIE Implementierung
0:51:20 MMIE Optimierung
0:52:16 Erweiterte Baum-Welch Regeln
0:54:59 MMIE Trainingsprozedur
0:57:21 Ergebnisse
0:58:00 MWE/MCE Training
1:07:31 Neue-Worte-Problem
1:09:31 Ansätze
1:11:02 Häufigkeitsverteilung von Wörtern
1:12:46 Herausvorderungen bei der OOV Detektion
1:14:11 OOV Wörtermodelle im AM
1:15:37 AM
1:16:03 OOV Wörtermodelle LM
1:17:49 Automatisches Clustern
1:18:06 Beispiele
1:19:36 Genauigkeit OOV Detektion
1:21:01 Lernen der neuen Wörter
1:21:32 Beispiel Lerndialog
Laufzeit (hh:mm:ss)
01:23:35
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17
Publiziert am
16.02.2017
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 108113 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 912771 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5015 s |
Dateiname | DIVA-2017-116_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 798562 bps |
Video Codec | h264 |
Mediathek-URL
Embed-Code