KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 21.10.2015, Vorlesung 02

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

02: Vorlesung |
0:00:00 Starten
0:03:02 Nachteile von ASR
0:11:10 Taxonomie von Sprache
0:19:02 Taxonomie von Spracherkennungssystemen/-aufgaben
0:33:30 Ist Spracherkennung schwierig?
0:36:26 Warum ist ASR schwierig?
0:39:37 Variabilität auf Signalebene
0:52:10 Variabilität auf phonetischer Ebene
0:55:25 Mehrdeutigkeit auf linguistischer Ebene
0:59:33 Segmentierung
1:02:32 Sprache aus Sicht der Maschine
1:03:55 Spracherkennung als Klassifikation
1:05:18 Große Datenmenge, viele Klassen
1:07:27 Menschen können ASR
1:22:25 Ein Experiment
1:26:49 Gebiete, die relevant sind

Laufzeit (hh:mm:ss)

01:29:03

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

17.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 105045 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 911072 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5343 s
Dateiname DIVA-2015-770_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799935 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22