KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 06.02.2017, 19

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

0:00:00 Starten
0:00:16 Minimierung des Wortfehlers
0:02:50 Approximierung mit N-besten Listen
0:04:06 WER Minimierung auf Wortgraphen
0:04:18 Multiple Alignment WER
0:07:03 Finden des globalen Alignment
0:08:21 Alignment als Äquivalenzrelation
0:09:44 Finden einer angemessenen Äquivalenzrelation
0:12:02 Intra-Wort-Clustern
0:14:58 Pruning
0:15:45 Confusionsnetzwerke
0:18:20 Confusionsnetzwer-Hypothese
0:19:20 Eyperimente
0:23:03 Systemkombination
0:25:00 Systemkombination mit ROVER
0:28:33 Alignierung vieler Hypothesen mittlels DP
0:29:30 Beispiel
0:30:46 Mehrheitsentscheidung
0:31:25 Experimente
0:34:28 Probleme mit EM Training
0:38:06 Korrektives Training
0:41:22 Diskriminatives Training
0:43:00 Maximierung der Posterioriw'keit
0:43:41 Transformation / Mutual Information
0:45:14 Maximum Mutual Information Estimation (MMIE)
0:47:52 MLE vs. MMIE
0:50:35 MMIE Implementierung
0:51:20 MMIE Optimierung
0:52:16 Erweiterte Baum-Welch Regeln
0:54:59 MMIE Trainingsprozedur
0:57:21 Ergebnisse
0:58:00 MWE/MCE Training
1:07:31 Neue-Worte-Problem
1:09:31 Ansätze
1:11:02 Häufigkeitsverteilung von Wörtern
1:12:46 Herausvorderungen bei der OOV Detektion
1:14:11 OOV Wörtermodelle im AM
1:15:37 AM
1:16:03 OOV Wörtermodelle LM
1:17:49 Automatisches Clustern
1:18:06 Beispiele
1:19:36 Genauigkeit OOV Detektion
1:21:01 Lernen der neuen Wörter
1:21:32 Beispiel Lerndialog

Laufzeit (hh:mm:ss)

01:23:35

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

16.02.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 108113 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 912771 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5015 s
Dateiname DIVA-2017-116_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 798562 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19