KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 23.11.2015, Vorlesung 09

Autor

Markus Müller

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:01:03 Hauptkomponentenanalyse (PCA)
  • 0:04:55 Lineare Diskriminanzanalyse
  • 0:06:42 Vorverarbeitung mit Neuronalen Netzen
  • 0:09:29 Bottleneck Features
  • 0:11:29 Klassifikation
  • 0:14:49 Statistische vs. Wissensbasierte Ansätze
  • 0:17:07 Wissensbasiert: Entscheidungsbäume
  • 0:18:09 Classification and Regression Trees
  • 0:22:26 Überwachtes vs. Unüberwachtes Lernen
  • 0:24:08 Unüberwachtes Lernen
  • 0:26:09 Überwachtes Lernen
  • 0:27:48 Parametrisches vs. Nicht-Parametrische Klassifikation
  • 0:28:56 Bayes Klassifikator
  • 0:32:02 Minimum Fehler Regel
  • 0:33:42 Parzen Fenster
  • 0:36:53 Spracherkennung mit Musterklassifikation
  • 0:39:04 Vergleich ganzer Äußerungen
  • 0:46:01 Time Warping
  • 0:47:28 Erinnerung: Minimale Editierdistanz
  • 0:50:19 Finden der minimalen Editierdistanz: DP Matrix
  • 0:52:20 Dynamic Time Warping (DTW)
  • 0:59:54 Strahlsuche
  • 1:02:12 Mögliche Distanzen von Vektoren
  • 1:03:01 Einordnung des DTW

Laufzeit (hh:mm:ss)

01:03:55

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

24.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 107537 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 913495 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 3835 s
Dateiname DIVA-2015-842_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799867 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22