KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 25.11.2015, Vorlesung 10

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

10: Vorlesung |
0:00:00 Starten
0:01:18 DTW für einzelne Wörter
0:09:35 DTW für Sequenzen mehrere Wörter
0:14:57 One Stage DP
0:33:51 Gaußverteilung (Normalverteilung)
1:05:01 Vektorquantisierung
1:11:11 Voronoiregionen
1:14:22 Mahalanobis Distanz
1:16:27 Vektorquantisierung als Klassifikationsproblem
1:17:52 K-Nächste Nachbar
1:22:05 Baumstruktur des Merkmalsraums
1:23:01 (Haus-) Aufgabe

Laufzeit (hh:mm:ss)

01:24:55

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

03.12.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 109298 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 915305 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5095 s
Dateiname DIVA-2015-887_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799916 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22