KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 23.11.2015, Vorlesung 09

Autor

Markus Müller

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

09: Vorlesung |
0:00:00 Starten
0:01:03 Hauptkomponentenanalyse (PCA)
0:04:55 Lineare Diskriminanzanalyse
0:06:42 Vorverarbeitung mit Neuronalen Netzen
0:09:29 Bottleneck Features
0:11:29 Klassifikation
0:14:49 Statistische vs. Wissensbasierte Ansätze
0:17:07 Wissensbasiert: Entscheidungsbäume
0:18:09 Classification and Regression Trees
0:22:26 Überwachtes vs. Unüberwachtes Lernen
0:24:08 Unüberwachtes Lernen
0:26:09 Überwachtes Lernen
0:27:48 Parametrisches vs. Nicht-Parametrische Klassifikation
0:28:56 Bayes Klassifikator
0:32:02 Minimum Fehler Regel
0:33:42 Parzen Fenster
0:36:53 Spracherkennung mit Musterklassifikation
0:39:04 Vergleich ganzer Äußerungen
0:46:01 Time Warping
0:47:28 Erinnerung: Minimale Editierdistanz
0:50:19 Finden der minimalen Editierdistanz: DP Matrix
0:52:20 Dynamic Time Warping (DTW)
0:59:54 Strahlsuche
1:02:12 Mögliche Distanzen von Vektoren
1:03:01 Einordnung des DTW

Laufzeit (hh:mm:ss)

01:03:55

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

24.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 107537 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 913495 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 3835 s
Dateiname DIVA-2015-842_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799867 bps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22