KIT-Bibliothek
Audio-/Videodatei publizieren

09: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 22.11.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:33 Spracherkennung mit Musterklassifikation
  • 0:03:37 Aufgabe
  • 0:04:55 Vergleich ganzer Äußerungen
  • 0:11:51 Time Warping
  • 0:14:19 Distanz zweier Äußerungen
  • 0:15:42 DP Matrix
  • 0:17:44 Dynamic Time Warping (DTW)
  • 0:20:24 Einschränkungen des DTW Pfades
  • 0:23:55 DTW-Schritte
  • 0:26:23 Der DTW Suchraum
  • 0:30:47 Mögliche Distanzen zwischen Vektoren
  • 0:35:43 Einordnung des DTW
  • 0:36:58 DTW für einzelne Wörter
  • 0:42:44 DTW für Sequenzen mehrerer Wörter
  • 0:48:16 One Stage DP
  • 0:51:35 One-Stage DP Implementierung
  • 0:56:47 One Stage DP Syntaktische Einschränkung
  • 1:00:03 Gaußverteilung (Normalverteilung)
  • 1:02:45 Multivariante Normalverteilung
  • 1:04:05 Kovarianzmatrix der Gaußverteilung
  • 1:09:06 Gauß-Mischverteilungen
  • 1:11:52 Benutzung in der Praxis
  • 1:15:30 Vektorquantisierung
  • 1:21:07 Voronoiregionen
  • 1:23:49 Mahalanobis Distanz
  • 1:25:08 Vektorquatisierung als Klassifikationsproblem
  • 1:27:04 K-Nächste Nachbar

Laufzeit (hh:mm:ss)

01:30:04

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

28.11.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 98219 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 904172 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5404 s
Dateiname DIVA-2017-700_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799857 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23