KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

20: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 29.01.2018

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

20 |
0:00:00 Starten
0:01:10 Mehrpass Suchen
0:03:15 beispiel: IBIS Single Pass Decoder
0:10:01 Consensus Decoding
0:13:08 Bsp: MAP vs. Wort-Posteriori-W‘keiten
0:17:54 Minimierung des Wortfehlers
0:21:23 Approximierung mit N-besten Listen
0:25:09 WER Minimierung auf Wortgraphen
0:33:50 Algiment als Äquivalenzrelation
0:37:22 Intra-Wort-Clustern
0:41:36 Confusionsnetzwerke
0:47:21 Systemkombonation
0:55:12 Mehrheitentscheidung
1:02:54 Probleme mit EM Training

Laufzeit (hh:mm:ss)

01:11:22

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

30.01.2018

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 128000 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 936008 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4282 s
Dateiname DIVA-2018-125_hd.mp4
Dateigröße 501.024.428 byte
Bildwiederholfrequenz 25
Videobitrate 801912 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23