KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 25.01.2016, Vorlesung 18

Autor

Markus Müller

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

18: Vorlesung |
0:00:00 Starten
0:00:37 Graphembasierte Spracherkennung
0:06:48 Eignung von Graphemen
0:14:38 Verteilung von Schriften
0:16:21 Verteilung der Schriftsysteme
0:17:12 Eignung von Graphemen
0:18:10 Beispiele für schlechte Korrespondenz
0:19:32 Graphembasierte ASR für Arabisch
0:20:19 Englisch, Deutsch, Russisch, Spanisch, Thai
0:21:12 Kontextabhängige Modelle für Grapheme ASR
0:23:10 Flexibler Clusterbaum für Grapheme
0:24:20 Praktische Probleme
0:27:13 Spracherkennung bei ungeschriebenen Sprachen
0:30:13 Plansprachen (Exkurs)
0:32:23 Esperanto
0:35:15 Esperanto und ASR
0:35:59 Toki Pona
0:37:55 Toki Pona und ASR
0:38:40 Entwurf einer Sprache für ASR
0:40:45 Entwurf von Ziffernwörtern
0:42:42 Ergebnis
0:43:49 ASR für Roboter Interaktion
0:47:01 ASR für Roboter Interaktion (Ausblick)

Laufzeit (hh:mm:ss)

00:50:05

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

28.01.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 107213 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 913095 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 3005 s
Dateiname DIVA-2016-117_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799794 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22