KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

05: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 08.11.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

05 |
0:00:00 Starten
0:00:31 Wortfehlerrate
0:03:26 Minimale Editierdistanz
0:09:36 Eigenschaften der WER
0:14:07 Probleme mit der WER?
0:18:00 WER in den DARPA Evaluationen
0:28:50 Grundlagen der Signalverarbeitng
0:29:25 Wozu Signal(vor)verarbeitung?
0:32:29 Systeme
0:35:19 Zeitinvariante System
0:36:54 Dirac Distribution
0:43:50 Faltung
0:46:58 Impulsantwort
0:56:30 Quelle Filter Modell der Sprache
0:59:41 Parametereigenschaften einer trigonometrischen Funktion
1:02:27 Darstellungen der Fourierreihe
1:07:29 Komplexes Spektrum
1:09:26 Fouriertransformation

Laufzeit (hh:mm:ss)

01:20:30

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

16.11.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 98420 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 764718 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4830 s
Dateiname DIVA-2017-629_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 660201 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23