KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 02.11.2015, Vorlesung 05

Autor

Sebastian Stüker

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:09 Überblick
  • 0:00:57 Animation des Vokaltrakts/Stroboskopaufnahme
  • 0:02:44 Konsonantenbeispiel
  • 0:05:06 Experimente
  • 0:11:48 Zwei Beispiele
  • 0:24:19 Geschichte der ASR
  • 0:30:43 Euphonia - speech Organ (1846)
  • 0:32:08 Radio Rex (1922)
  • 0:34:08 Vocoder (1939)
  • 0:35:20 HARPY (1976)
  • 0:37:32 Wortfehlerrate
  • 0:40:37 Minimale Editierdistanz
  • 0:49:58 Ein Beispiel
  • 0:50:43 Eigenschaften der WER
  • 0:52:46 Probleme mit der WER?
  • 0:56:33 WER in den DARPA Evaluationen
  • 1:11:48 Grundlagen der Signalverarbeitung
  • 1:14:08 Wozu Signal(vor)verarbeitung?
  • 1:21:52 Systeme

Laufzeit (hh:mm:ss)

01:24:17

Serie

Grundlagen der Automatischen Spracherkennung, WS 2015/2016

Publiziert am

17.11.2015

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 108113 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 914081 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5057 s
Dateiname DIVA-2015-773_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799876 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, WS 2015/2016 Folgen 1-22 von 22