KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 26.10.2016, 04

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

04 |
0:00:00 Starten
0:00:04 Inhalt: Mikrofone, Wortfehlerrate
0:00:40 Mikrofone
0:01:25 Wandlerprinzipien
0:02:21 Richtcharakterristik
0:05:56 Akustische Bauformen
0:20:12 Pop- und Windschutz
0:23:44 Geschichte der ASR
0:39:56 Euphonia – Speech Organ (1846)
0:41:03 Radio Rex (1922)
0:43:11 Vocoder (1939)
0:43:59 HARPY (1976)
0:48:19 Wortfehlerrate
0:50:19 Minimale Editierdistanz
0:51:08 Ein Beispiel
0:52:02 Eigenschaften der WER
0:57:44 Probleme mit der WER
1:02:55 WER in den DARPA Evaluationen
1:17:46 Grundlagen der Signalverarbeitung
1:19:39 Wozu Signal(vor)verarbeitung?

Laufzeit (hh:mm:ss)

01:23:35

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

03.11.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 105383 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 911263 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5015 s
Dateiname DIVA-2016-678_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799789 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19