KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

02: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 18.10.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

02 |
0:00:00 Starten
0:00:19 Heute
0:01:24 Taxonomie von Sprache
0:02:30 Taxonomie von Spracherkennungssystemen/-aufgaben
0:12:48 Ist Spracherkennung schwierig?
0:16:35 Warum ist ASR schwierig?
0:21:49 Variabilität auf Signalebene
0:25:37 Variabilität auf phonetischer Ebene
0:30:00 Mehrdeutigkeit auf linguistischer Ebene
0:33:17 Segmentierung
0:36:13 Sprache aus Sicht der Maschine
0:37:05 Spracherkennung als Klassifikation
0:37:58 Große Datenmengen, viele Klassen
0:39:57 Menschen können ASR
0:42:08 Experiment
0:54:37 Die Vogelperspektive
0:58:53 Gebiete, die relevant sind
1:00:44 Sprachproduktion
1:01:52 Artikulationsapparat
1:03:55 Animation des Vokaltrakts/Stroboskopaufnahme
1:12:01 Stimmhafte Sprache
1:16:28 Stimmlose Sprache

Laufzeit (hh:mm:ss)

01:22:15

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

23.10.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 99913 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 906149 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4935 s
Dateiname DIVA-2017-530_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 800144 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23