KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 16.01.2017, 17

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

17 |
0:00:00 Starten
0:00:04 Suche
0:01:31 Erinnerung: Fundamentalformel
0:02:05 Suche in der Spracherkennung
0:05:08 Erinnerung DTW und One-Stage-DP
0:07:02 Suche im Allgemeinen
0:09:33 Suche mit DP und Heuristik
0:11:37 Kenngrößen für Suchprobleme
0:14:42 Forward-/Backward-/bi-direktionale Suche
0:16:34 Explizite vs. Implizite Implementierung
0:18:15 Blinde Suche
0:19:51 Suchstrategien
0:24:49 Tiefensuche vs. Breitensuche
0:25:58 Heuristische Graphsuche
0:28:42 Zeitasynchrone Suche mit A*
0:33:13 Zeitsynchrone Strahlsuche
0:38:16 Beams in ASR
0:40:15 Beam vs. WER
0:51:26 Kontinuierliche Suchräume, gleichverteiltes Sprachmodell
0:54:51 Suchraum mit Uni-Gramm
0:58:16 Suchraum mit Bi-Grammen
1:00:59 Suchraum mit Tri-Grammen
1:05:58 Viterbi Decoding
1:12:51 A* mit Stack Decoder
1:14:40 Heuristik für A*
1:16:42 Fast Match

Laufzeit (hh:mm:ss)

01:19:29

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

19.01.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 105004 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 906641 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4770 s
Dateiname DIVA-2017-34_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 795544 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19