KIT-Bibliothek
Audio-/Videodatei publizieren

02: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 18.10.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:19 Heute
  • 0:01:24 Taxonomie von Sprache
  • 0:02:30 Taxonomie von Spracherkennungssystemen/-aufgaben
  • 0:12:48 Ist Spracherkennung schwierig?
  • 0:16:35 Warum ist ASR schwierig?
  • 0:21:49 Variabilität auf Signalebene
  • 0:25:37 Variabilität auf phonetischer Ebene
  • 0:30:00 Mehrdeutigkeit auf linguistischer Ebene
  • 0:33:17 Segmentierung
  • 0:36:13 Sprache aus Sicht der Maschine
  • 0:37:05 Spracherkennung als Klassifikation
  • 0:37:58 Große Datenmengen, viele Klassen
  • 0:39:57 Menschen können ASR
  • 0:42:08 Experiment
  • 0:54:37 Die Vogelperspektive
  • 0:58:53 Gebiete, die relevant sind
  • 1:00:44 Sprachproduktion
  • 1:01:52 Artikulationsapparat
  • 1:03:55 Animation des Vokaltrakts/Stroboskopaufnahme
  • 1:12:01 Stimmhafte Sprache
  • 1:16:28 Stimmlose Sprache

Laufzeit (hh:mm:ss)

01:22:15

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

23.10.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 99913 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 906149 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4935 s
Dateiname DIVA-2017-530_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 800144 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23