KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

14: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 11.12.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

14 |
0:00:00 Starten
0:00:35 Polyphone - Datenmangel
0:03:50 Polyphone
0:10:07 Backoff für Polyphone
0:13:27 Bottom-Up vs. Top-Down Clustering
0:17:38 Distanzen für Polyphonecluster
0:23:08 Diskrete Entropiedistanz
0:29:30 Gewichtete Entropiedistanz
0:32:27 Clustern von Polyphonen mit Entropiedistanz
0:38:59 Clustern nach Kai-Fu Lee
0:48:37 Clustering mit Entscheidungsbäumen
0:53:37 Top-Down Clustern

Laufzeit (hh:mm:ss)

00:59:06

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

11.12.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 99642 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 905625 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 3546 s
Dateiname DIVA-2017-775_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799894 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23