KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

19: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 24.01.2018

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

19 |
0:00:00 Starten
0:00:09 Start
0:00:22 Kontinuierliche Suchräume, gleichverteiltes Sprachmodell
0:07:31 Suchraum mit Tri-Grammen
0:08:57 Viterbi Decoding
0:13:15 A* mit Stack Decoder
0:16:43 Heuristik für A*
0:21:35 Fast Match
0:25:21 Vor- und Nachteile Stackdecoder
0:28:35 A* vs. Strahlsuche
0:33:40 Vermeidung von Redundanzen
0:36:53 Baumsuche
0:39:27 Baumsuche mit Sprachmodell
0:41:46 Delayed Bi-Grams
0:43:36 Einsparung durch Baum-Lexica
0:48:20 Kopien von Suchbäumen
0:54:12 Suche mit kontextabhängigen Modellen
0:54:49 Baumsuche mit kontextabhängigen Modellen
0:59:02 N-Besten Suche
1:05:18 Probleme mit n besten Listen
1:08:31 Wortgraphen
1:11:16 Zusammenfassung Beschleunigungstechniken
1:12:58 Mehrpass Suchen

Laufzeit (hh:mm:ss)

01:14:02

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

26.01.2018

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 128000 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 930794 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4442 s
Dateiname DIVA-2018-102_hd.mp4
Dateigröße 516.834.069 byte
Bildwiederholfrequenz 25
Videobitrate 796696 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23