KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

07: Kognitive Systeme, Vorlesung, SS 2017, 31.05.2017

Autor

Alexander Waibel

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

07 |
0:00:00 Starten
0:00:10 Lecture Demos
0:00:42 Spectogram Controls
0:09:49 Speech: State-of-the-Art
0:14:09 Sloppy Speech
0:16:47 Speech Recognition (System Overview)
0:20:21 Voiced and Unvoiced Phonemes
0:21:35 Analog to Digital
0:21:50 Front End Processing
0:23:49 Linear Sequence Alignment
0:25:15 Problem with Linear Alignment
0:28:08 Speech Recognition (Components)
0:30:50 Spectogram
0:32:04 Markov Models
0:36:18 Single Fair Coin
0:37:23 Discrete Observation HMM
0:40:54 Hidden Markov Models
0:45:25 Acoustic Modeling
0:48:13 HMM Problems and Solutions
0:51:35 Evaluation
0:54:08 The Forward Algorithm
0:58:58 Forward Trellis
1:04:39 The Backward Algorithm
1:05:00 Decoding
1:08:35 Viterbi Trellis

Laufzeit (hh:mm:ss)

01:09:10

Serie

Kognitive Systeme, Vorlesung, SS 2017

Publiziert am

09.06.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 127667 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 935331 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4150 s
Dateiname DIVA-2017-319_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 801570 kbps
Video Codec h264

Embed-Code