KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

10: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 27.11.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

10 |
0:00:00 Starten
0:00:20 Vektorquantisierung
0:01:07 Voronoiregionen
0:01:19 Mahalanobis Distanz
0:01:39 Vektorquantisierung als Klassifikationsproblem
0:02:14 K-Nächte Nachbar
0:03:21 Beschleunigung von KNN
0:15:21 Baumstruktur des Merkmalsraum
0:16:20 Aufgabe
0:26:15 Finden von Referenzvektoren
0:26:56 K-Mittelwerte
0:29:09 Learning VQ
0:31:24 LVQ2, LVQ3
0:32:53 LVQ als KNN
0:37:13 Literaturempfehlung zu dieser Vorlesung
0:38:45 Stochastik in der Spracherkennung
0:46:57 Die Fundamentalformel
0:53:27 Stochastische ASR Akustisches Modell
0:54:33 Die Fundamentalformel
0:56:21 Stochastischer Prozess
1:06:03 Markow-Kette
1:07:35 Markow-Kette n-ter Ordnung
1:09:13 Markow-Ketten 1.Ordnung
1:11:15 Homogene Makow-Ketten 1.Ordnung
1:12:05 Beispiele
1:19:44 Hidden Markov Models

Laufzeit (hh:mm:ss)

01:20:53

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

30.11.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 101491 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 907456 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4853 s
Dateiname DIVA-2017-709_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799870 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23