KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 18.01.2017, 18

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

18 |
0:00:00 Starten
0:01:22 Vor- und Nachteile eines Stackdecoders
0:05:30 A* vs. Strahlsuche
0:07:22 Vermeidung von Redundanzen
0:09:23 Baumsuche
0:12:11 Baumsuche mit Sprachmodell
0:13:54 Delayed Bi-Grams
0:21:15 Einsparung durch Baum-Lexica
0:25:40 Kopien von Suchbäumen
0:29:50 Suche mit kontextabhängigen Modellen
0:32:24 Baumsuche mit kontextabhängigen Modellen
0:35:58 N-Besten Suche
0:43:27 Probleme mit n besten Listen
0:45:27 Wortgraphen
0:47:39 Zusammenfassung Beschleunigungstechniken
0:49:35 Mehrpass Suchen
0:50:53 Beispiel: IBIS Single Pass Decoder
0:53:48 Delayed Bi-Grams
1:00:17 Consensus Decoding
1:02:38 Bsp: MAP vs. Wort-Posteriori-W'keiten
1:08:34 Minimierung des Wortfehlers
1:12:50 Approximierung mit N-besten Listen
1:14:55 WER Minimierung auf Wortgraphen
1:17:16 Multiple Alignment WER

Laufzeit (hh:mm:ss)

01:20:14

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

25.01.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 99170 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 900861 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4814 s
Dateiname DIVA-2017-63_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 795599 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19