Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 21.12.2015, Vorlesung 14
Autor
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:02:34 Polyphone
- 0:03:32 Polyphone-Datenmangel
- 0:04:32 Anzahl der Polyphone
- 0:05:46 Häufigkeiten der Polyphone
- 0:07:42 Backoff für Polyphone
- 0:10:10 Gekoppelte Polyphone
- 0:11:32 Bottom-Up vs. Top-Down Clustering
- 0:13:15 Bottom-Up Clustering
- 0:13:41 Top-Down Clustering
- 0:14:30 Probleme beim Clustering
- 0:15:48 Distanzen für Polyphonecluster
- 0:20:53 Diskrete Entropiedistanz
- 0:26:50 Gewichtete Entropiedistanz
- 0:29:58 Clustern von Polyphonen mit Entropiedistanz
- 0:32:00 Clustern nach Kai-Fu Lee
- 0:39:11 Problem der Vokabularbeschränktheit
- 0:40:12 Clustering mit Entscheidungsbäumen
- 0:42:03 Top-Down Clustern
- 0:44:02 Der Wachstumsprozess
- 0:44:29 Während der Erkennung
- 0:45:27 Abbruchkriterium für das Clustern
- 0:48:07 Clustern mit Likelihood Distanz
- 0:50:01 Problem bei Clustern mit Likelihood Distanz
- 0:52:04 Kontextfragen
- 0:57:47 Typische Kontextfragen
- 1:00:45 Abdeckung durch Polyphone
- 1:04:53 Gewinn durch längere Kontexte
Laufzeit (hh:mm:ss)
01:05:50
Serie
Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Publiziert am
07.01.2016
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 106792 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 912695 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 3950 s |
Dateiname | DIVA-2016-8_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 799812 bps |
Video Codec | h264 |
Mediathek-URL
Embed-Code
Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Folgen 1-22
von 22