KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 14.11.2016, 08

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

08 |
0:00:00 Starten
0:00:14 Hauptkomponentenalyse (PCA)
0:02:40 Lineare Diskriminanzanalyse
0:05:21 Vorverarbeitung mit Neuronalen Netzen
0:10:11 Bottelneck Features
0:13:56 Klassifikation
0:15:30 Aufgabe (1)
0:21:36 Statistische vs. Wissensbasierte Ansätze
0:23:15 Wissensbasiert: Entscheidungsbäume
0:25:00 Classification and Regression Trees
0:28:37 Überwachtes vs. Unüberwachtes Lernen
0:30:09 Unüberwachtes Lernen
0:30:31 Überwachtes Lernen
0:31:32 Parametrische vs. Nicht-Parametrische Klassifikation
0:35:22 Bayes Klassifikator
0:37:50 Minimum Fehler Regel
0:37:59 Entscheidungsgrenze
0:39:00 Parzen Fenster
0:39:21 Spracherkennung mit Musterklssifikation
0:41:43 Vergleich ganzer Äußerungen (1)
0:43:48 Aufgabe (2)
0:46:26 Vergleich ganzer Äußerungen (2)
0:50:10 Time Warping
0:51:07 Distanz zweier Äußerungen
0:52:49 Erinnerung MInimale Editierdistanz
0:53:37 DP Matrix
0:54:14 Dynamic Time Warping (DTW)
0:56:03 Einschränkungen des DTW Pfades
0:58:46 DTW Schritte
0:59:46 Globale Einschränkungen
1:00:50 Der DTW Suchraum
1:04:24 Strahlsuche
1:06:01 Mögliche Distanzen zwischen Vektoren

Laufzeit (hh:mm:ss)

01:11:52

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

21.11.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 100074 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 846901 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4312 s
Dateiname DIVA-2016-733_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 740732 bps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19