KIT-Bibliothek

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 16.01.2017, 17

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:04 Suche
  • 0:01:31 Erinnerung: Fundamentalformel
  • 0:02:05 Suche in der Spracherkennung
  • 0:05:08 Erinnerung DTW und One-Stage-DP
  • 0:07:02 Suche im Allgemeinen
  • 0:09:33 Suche mit DP und Heuristik
  • 0:11:37 Kenngrößen für Suchprobleme
  • 0:14:42 Forward-/Backward-/bi-direktionale Suche
  • 0:16:34 Explizite vs. Implizite Implementierung
  • 0:18:15 Blinde Suche
  • 0:19:51 Suchstrategien
  • 0:24:49 Tiefensuche vs. Breitensuche
  • 0:25:58 Heuristische Graphsuche
  • 0:28:42 Zeitasynchrone Suche mit A*
  • 0:33:13 Zeitsynchrone Strahlsuche
  • 0:38:16 Beams in ASR
  • 0:40:15 Beam vs. WER
  • 0:51:26 Kontinuierliche Suchräume, gleichverteiltes Sprachmodell
  • 0:54:51 Suchraum mit Uni-Gramm
  • 0:58:16 Suchraum mit Bi-Grammen
  • 1:00:59 Suchraum mit Tri-Grammen
  • 1:05:58 Viterbi Decoding
  • 1:12:51 A* mit Stack Decoder
  • 1:14:40 Heuristik für A*
  • 1:16:42 Fast Match

Laufzeit (hh:mm:ss)

01:19:29

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

19.01.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 105004 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 906641 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4770 s
Dateiname DIVA-2017-34_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 795544 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19