Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 01.02.2016, Vorlesung 20
Autor
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
- 0:00:00 Starten
- 0:00:19 Suchstrategien
- 0:01:25 Tiefensuche vs. Breitensuche
- 0:01:57 Heuristische Graphsuche
- 0:02:45 Zeitasynchrone Suche mit A*
- 0:04:15 Zeitsynchrone Strahlsuche
- 0:10:31 Beams in ASR
- 0:12:13 Beam vs. WER
- 0:15:45 Kontinuierliche Suchräume, gleichverteiltes Sprachmodell
- 0:20:59 Suchraum mit Uni-Gramm
- 0:23:03 Suchraum mit Bi-Grammen
- 0:26:32 Suchraum mit Tri-Grammen
- 0:33:48 Viterbi Decoding
- 0:40:42 A* mit Stack Decoder
- 0:42:50 Heuristik für A*
- 0:44:43 Fast Match
- 0:47:36 Vor- und Nachteile eines Stackdecoders
- 0:51:10 A* vs. Strahlsuche
- 0:52:39 Vermeidung von Redundanzen
- 0:54:44 Baumsuche
- 0:57:30 Baumsuche mit Sprachmodell
- 0:59:04 Delayed Bi-Grams
- 1:01:51 Einsparung durch Baum-Lexica
- 1:05:41 Kopien von Suchbäumen
- 1:10:36 Suche mit kontextabhängigen Modellen
- 1:13:38 Baumsuche mit kontextabhängigen Modellen
- 1:16:45 N-Besten Suche
Laufzeit (hh:mm:ss)
01:23:29
Serie
Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Publiziert am
05.02.2016
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 108383 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 914367 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 5009 s |
Dateiname | DIVA-2016-158_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 799892 bps |
Video Codec | h264 |
Mediathek-URL
Embed-Code
Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Folgen 1-22
von 22