02: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 18.10.2017
Autor
Herausgeber
Beteiligtes Institut
Institut für Anthropomatik und Robotik (IAR)
Genre
Beschreibung
02 |
0:00:00 Starten
0:00:19 Heute
0:01:24 Taxonomie von Sprache
0:02:30 Taxonomie von Spracherkennungssystemen/-aufgaben
0:12:48 Ist Spracherkennung schwierig?
0:16:35 Warum ist ASR schwierig?
0:21:49 Variabilität auf Signalebene
0:25:37 Variabilität auf phonetischer Ebene
0:30:00 Mehrdeutigkeit auf linguistischer Ebene
0:33:17 Segmentierung
0:36:13 Sprache aus Sicht der Maschine
0:37:05 Spracherkennung als Klassifikation
0:37:58 Große Datenmengen, viele Klassen
0:39:57 Menschen können ASR
0:42:08 Experiment
0:54:37 Die Vogelperspektive
0:58:53 Gebiete, die relevant sind
1:00:44 Sprachproduktion
1:01:52 Artikulationsapparat
1:03:55 Animation des Vokaltrakts/Stroboskopaufnahme
1:12:01 Stimmhafte Sprache
1:16:28 Stimmlose Sprache
Laufzeit (hh:mm:ss)
01:22:15
Serie
Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18
Publiziert am
23.10.2017
Fachgebiet
Lizenz
Auflösung | 1280 x 720 Pixel |
Seitenverhältnis | 16:9 |
Audiobitrate | 99913 bps |
Audio Kanäle | 2 |
Audio Codec | aac |
Audio Abtastrate | 48000 Hz |
Gesamtbitrate | 906149 bps |
Farbraum | yuv420p |
Container | mov,mp4,m4a,3gp,3g2,mj2 |
Medientyp | video/mp4 |
Dauer | 4935 s |
Dateiname | DIVA-2017-530_hd.mp4 |
Dateigröße | 4.096 byte |
Bildwiederholfrequenz | 25 |
Videobitrate | 800144 bps |
Video Codec | h264 |
Embed-Code