KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 02.11.2015, Vorlesung 05

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

05: Vorlesung |
0:00:00 Starten
0:00:09 Überblick
0:00:57 Animation des Vokaltrakts/Stroboskopaufnahme
0:02:44 Konsonantenbeispiel
0:05:06 Experimente
0:11:48 Zwei Beispiele
0:24:19 Geschichte der ASR
0:30:43 Euphonia - speech Organ (1846)
0:32:08 Radio Rex (1922)
0:34:08 Vocoder (1939)
0:35:20 HARPY (1976)
0:37:32 Wortfehlerrate
0:40:37 Minimale Editierdistanz
0:49:58 Ein Beispiel
0:50:43 Eigenschaften der WER
0:52:46 Probleme mit der WER?
0:56:33 WER in den DARPA Evaluationen
1:11:48 Grundlagen der Signalverarbeitung
1:14:08 Wozu Signal(vor)verarbeitung?
1:21:52 Systeme

Laufzeit (hh:mm:ss)

01:24:17

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

17.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 108113 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 914081 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5057 s
Dateiname DIVA-2015-773_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799876 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22