KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 01.02.2016, Vorlesung 20

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:19 Suchstrategien
  • 0:01:25 Tiefensuche vs. Breitensuche
  • 0:01:57 Heuristische Graphsuche
  • 0:02:45 Zeitasynchrone Suche mit A*
  • 0:04:15 Zeitsynchrone Strahlsuche
  • 0:10:31 Beams in ASR
  • 0:12:13 Beam vs. WER
  • 0:15:45 Kontinuierliche Suchräume, gleichverteiltes Sprachmodell
  • 0:20:59 Suchraum mit Uni-Gramm
  • 0:23:03 Suchraum mit Bi-Grammen
  • 0:26:32 Suchraum mit Tri-Grammen
  • 0:33:48 Viterbi Decoding
  • 0:40:42 A* mit Stack Decoder
  • 0:42:50 Heuristik für A*
  • 0:44:43 Fast Match
  • 0:47:36 Vor- und Nachteile eines Stackdecoders
  • 0:51:10 A* vs. Strahlsuche
  • 0:52:39 Vermeidung von Redundanzen
  • 0:54:44 Baumsuche
  • 0:57:30 Baumsuche mit Sprachmodell
  • 0:59:04 Delayed Bi-Grams
  • 1:01:51 Einsparung durch Baum-Lexica
  • 1:05:41 Kopien von Suchbäumen
  • 1:10:36 Suche mit kontextabhängigen Modellen
  • 1:13:38 Baumsuche mit kontextabhängigen Modellen
  • 1:16:45 N-Besten Suche

Laufzeit (hh:mm:ss)

01:23:29

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

05.02.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 108383 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 914367 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5009 s
Dateiname DIVA-2016-158_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799892 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22