KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 30.11.2015, Vorlesung 11

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

11: Vorlesung |
0:00:00 Starten
0:01:05 Aufgabe
0:10:18 Vektorquantisierung
0:11:47 Finden von Referenzvektoren
0:12:57 K-Mittelwerte
0:15:53 Learning VQ
0:18:12 LVQ 2, LVQ3
0:20:27 LVQ als KNN
0:29:42 Literaturempfehlung zu Statische Spracherkennung
0:30:39 Stochastik in der Spracherkennung
0:34:35 Die Fundamentalformel
0:39:58 Stochastische ASR - Akustische Modell
0:43:56 Stochastischer Prozess
0:49:12 Markow-Kette
0:51:11 Markow-Kette n-ter Ordnung
0:53:01 Markow-Ketten 1.Ordnung
0:54:59 Homogene Markow-Ketten 1.Ordnung
0:55:46 Beispiele
1:02:41 Hidden Markov Models
1:10:41 Urne Ball Modell
1:12:04 HMM Definition
1:15:01 HMM Beobachtungsgenerierung
1:16:52 Die HMM Trellis
1:18:53 Die Drei Probleme der HMMs

Laufzeit (hh:mm:ss)

01:20:17

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

03.12.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 107080 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 913083 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4817 s
Dateiname DIVA-2015-920_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799911 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22