10: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 27.11.2017
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:20 Vektorquantisierung
- 0:01:07 Voronoiregionen
- 0:01:19 Mahalanobis Distanz
- 0:01:39 Vektorquantisierung als Klassifikationsproblem
- 0:02:14 K-Nächte Nachbar
- 0:03:21 Beschleunigung von KNN
- 0:15:21 Baumstruktur des Merkmalsraum
- 0:16:20 Aufgabe
- 0:26:15 Finden von Referenzvektoren
- 0:26:56 K-Mittelwerte
- 0:29:09 Learning VQ
- 0:31:24 LVQ2, LVQ3
- 0:32:53 LVQ als KNN
- 0:37:13 Literaturempfehlung zu dieser Vorlesung
- 0:38:45 Stochastik in der Spracherkennung
- 0:46:57 Die Fundamentalformel
- 0:53:27 Stochastische ASR Akustisches Modell
- 0:54:33 Die Fundamentalformel
- 0:56:21 Stochastischer Prozess
- 1:06:03 Markow-Kette
- 1:07:35 Markow-Kette n-ter Ordnung
- 1:09:13 Markow-Ketten 1.Ordnung
- 1:11:15 Homogene Makow-Ketten 1.Ordnung
- 1:12:05 Beispiele
- 1:19:44 Hidden Markov Models
Laufzeit (hh:mm:ss)
01:20:53
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Publiziert am
30.11.2017
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 101491 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 907456 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 4853 s |
Dateiname | DIVA-2017-709_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 799870 bps |
Video Codec | h264 |
Mediathek-URL
Embed-Code
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Folgen 1-23
von 23