KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 16.11.2016, 09

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:26 DTW für einzelne Wörter
  • 0:03:44 DTW für Sequenzen mehrere Wörter
  • 0:09:45 One Stage DP
  • 0:12:48 One Stage DP Implementierung
  • 0:17:29 One Stage DP Syntaktische Einschränkung
  • 0:20:34 Gaußverteilung (Normalverteilung)
  • 0:26:12 Multivariate Normalverteilung
  • 0:27:33 Kovarianzmatrix der Gaußverteilung
  • 0:34:24 Gauß-Mischverteilung
  • 0:35:16 Benutzung in der Praxis
  • 0:44:11 Vektorquantisierung
  • 0:46:54 Voronoiregionen
  • 0:48:46 Mahalanobis Distanz
  • 0:49:53 Vektorquantisierung als Klassifikationsproblem
  • 0:51:54 K-Nächste Nachbar
  • 0:53:58 Beschleunigung von KNN
  • 1:00:46 Baumstruktur des Merkmalsraums
  • 1:01:41 Aufgabe
  • 1:09:34 Finden von Referenzvektoren
  • 1:10:33 K-MIttelwerte
  • 1:13:07 Learning VQ
  • 1:14:48 LVQ 2, LVQ 3
  • 1:16:18 LVQ als KNN

Laufzeit (hh:mm:ss)

01:20:59

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

21.11.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 99596 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 748647 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4859 s
Dateiname DIVA-2016-734_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 642957 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19