KIT-Bibliothek

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 21.12.2015, Vorlesung 14

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:02:34 Polyphone
  • 0:03:32 Polyphone-Datenmangel
  • 0:04:32 Anzahl der Polyphone
  • 0:05:46 Häufigkeiten der Polyphone
  • 0:07:42 Backoff für Polyphone
  • 0:10:10 Gekoppelte Polyphone
  • 0:11:32 Bottom-Up vs. Top-Down Clustering
  • 0:13:15 Bottom-Up Clustering
  • 0:13:41 Top-Down Clustering
  • 0:14:30 Probleme beim Clustering
  • 0:15:48 Distanzen für Polyphonecluster
  • 0:20:53 Diskrete Entropiedistanz
  • 0:26:50 Gewichtete Entropiedistanz
  • 0:29:58 Clustern von Polyphonen mit Entropiedistanz
  • 0:32:00 Clustern nach Kai-Fu Lee
  • 0:39:11 Problem der Vokabularbeschränktheit
  • 0:40:12 Clustering mit Entscheidungsbäumen
  • 0:42:03 Top-Down Clustern
  • 0:44:02 Der Wachstumsprozess
  • 0:44:29 Während der Erkennung
  • 0:45:27 Abbruchkriterium für das Clustern
  • 0:48:07 Clustern mit Likelihood Distanz
  • 0:50:01 Problem bei Clustern mit Likelihood Distanz
  • 0:52:04 Kontextfragen
  • 0:57:47 Typische Kontextfragen
  • 1:00:45 Abdeckung durch Polyphone
  • 1:04:53 Gewinn durch längere Kontexte

Laufzeit (hh:mm:ss)

01:05:50

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

07.01.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 106792 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 912695 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 3950 s
Dateiname DIVA-2016-8_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799812 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22