KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 12.12.2016, 14

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

14 |
0:00:00 Starten
0:00:09 Wiederholung
0:03:29 Kontextfragen
0:09:30 Typische Kontextfragen
0:13:15 Abdeckung durch Polyphone
0:14:51 Gewinn durch längere Kontexte
0:16:21 Verwendung dynamischer Modalitäten
0:17:38 Dynamische Modalitäten
0:29:29 Fehler durch Falsche Aussprachen
0:31:19 Generierung von Aussprachewörterbüchern
0:39:42 Verwendung von existierenden Wörterbüchern
0:43:58 Lernen von Ausspracheregeln
0:51:00 Inkrementelles Lernen
0:53:28 Aussprachevarianten
0:56:08 Finden von Aussprachevarianten
0:57:32 Probleme mit Aussprachevarianten
1:02:59 Typische Aussprachevarianten
1:03:38 Regeln für Aussprachevarianten im Deutschen
1:04:40 Datengetriebenes Finden von Aussprachevarianten
1:07:48 Finden von Aussprachevarianten mit dem Silbenmodell
1:09:22 Flexibles Trainingsalignment

Laufzeit (hh:mm:ss)

01:11:32

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

20.12.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 102169 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 903762 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4293 s
Dateiname DIVA-2016-826_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 795500 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19