09: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 22.11.2017
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:33 Spracherkennung mit Musterklassifikation
- 0:03:37 Aufgabe
- 0:04:55 Vergleich ganzer Äußerungen
- 0:11:51 Time Warping
- 0:14:19 Distanz zweier Äußerungen
- 0:15:42 DP Matrix
- 0:17:44 Dynamic Time Warping (DTW)
- 0:20:24 Einschränkungen des DTW Pfades
- 0:23:55 DTW-Schritte
- 0:26:23 Der DTW Suchraum
- 0:30:47 Mögliche Distanzen zwischen Vektoren
- 0:35:43 Einordnung des DTW
- 0:36:58 DTW für einzelne Wörter
- 0:42:44 DTW für Sequenzen mehrerer Wörter
- 0:48:16 One Stage DP
- 0:51:35 One-Stage DP Implementierung
- 0:56:47 One Stage DP Syntaktische Einschränkung
- 1:00:03 Gaußverteilung (Normalverteilung)
- 1:02:45 Multivariante Normalverteilung
- 1:04:05 Kovarianzmatrix der Gaußverteilung
- 1:09:06 Gauß-Mischverteilungen
- 1:11:52 Benutzung in der Praxis
- 1:15:30 Vektorquantisierung
- 1:21:07 Voronoiregionen
- 1:23:49 Mahalanobis Distanz
- 1:25:08 Vektorquatisierung als Klassifikationsproblem
- 1:27:04 K-Nächste Nachbar
Laufzeit (hh:mm:ss)
01:30:04
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Publiziert am
28.11.2017
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 98219 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 904172 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5404 s |
Dateiname | DIVA-2017-700_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 799857 bps |
Video Codec | h264 |
Mediathek-URL
Embed-Code
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Folgen 1-23
von 23