KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 03.02.2016, Vorlesung 21

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:10 Suche
  • 0:00:29 N-Besten Suche
  • 0:01:50 Probleme mit n besten Listen
  • 0:02:54 Wortgraphen
  • 0:04:14 Zusammenfassung Beschleunigungstechniken
  • 0:06:00 Mehrpass Suchen
  • 0:06:55 Beispiel: IBIS Single Pass Decoder
  • 0:11:18 Consensus Decoding
  • 0:13:01 Bsp: MAP vs. Wort-Posteriori-W´keiten
  • 0:16:36 Minimierung des Wortfehlers
  • 0:19:28 Approximierung mit N-besten Listen
  • 0:21:36 WER Minimierung auf Wortgraphen
  • 0:24:26 Multiple Alignment WER
  • 0:29:19 Finden des globalen Alignment
  • 0:30:50 Multiple Alignment WER
  • 0:32:37 Alignment als Äquivalenzrelation
  • 0:34:37 Finden einer angemessenen Äquivalenzrelation
  • 0:36:38 Intra-Wort-Clustern
  • 0:38:44 Pruning
  • 0:40:37 Confusionsnetzwerke
  • 0:42:28 Multiple Alignment WER
  • 0:43:03 Confusionsnetzwerke
  • 0:43:26 Confusionsnetzwer-Hypothese
  • 0:45:16 Multiple Alignment WER
  • 0:45:53 Experimente
  • 0:47:58 Systemkombination
  • 0:49:14 Systemkombination mit ROVER
  • 0:50:27 Alignierung vieler Hypothesen mittels DP
  • 0:51:49 Beispiel

Laufzeit (hh:mm:ss)

00:59:08

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

08.02.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 109201 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 915149 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 3548 s
Dateiname DIVA-2016-160_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799859 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22