KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

15: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 18.12.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

15 |
0:00:00 Starten
0:01:53 Clustern mit Likelihood Distanz
0:04:33 Kontextfragen
0:12:44 Typische Kontextfragen
0:16:37 Abdeckung durch Polyphone
0:19:48 Gewinn durch längere Kontexte
0:21:40 Verwendung dynamischer Modalitäten
0:24:17 Dynamische Modalitäten
0:39:58 Fehler durch falsche Aussprache
0:42:25 Generierung von Aussprachewörterbüchern
0:44:38 Verwendung von existierenden Wörterbüchern
0:47:34 Lernen von Ausspracheregeln
1:00:33 Inkrementelles Lernen
1:02:35 Aussprachevarianten
1:05:18 Finden von Aussprachevarianten
1:06:55 Probleme mit Aussprachevarianten
1:11:50 Regeln für Aussprachevarianten im Deutschen
1:15:47 Finden von Aussprachevarianten mit dem Silbenmodell
1:17:49 Aussprachen bestimmen für unüberwachtes Lernen
1:20:49 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)

Laufzeit (hh:mm:ss)

01:23:55

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

19.12.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 97050 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 902983 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5035 s
Dateiname DIVA-2017-805_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799838 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23