KIT-Bibliothek
Audio-/Videodatei publizieren

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17, 19.10.2016, 02

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

02 |
0:00:00 Starten
0:00:09 Einführung und Anwendungen
0:01:08 Ist Spracherkennung Schwierig?
0:02:00 Warum ist ASR schwierg?
0:02:51 Variabilität auf Signalebene
0:09:44 Variabilität auf phonetischer Ebene
0:12:57 Mehrdeutigkeit auf linguistischer Ebene
0:16:32 Segmentierung
0:18:24 Sprache aus Sicht der Maschine
0:19:15 Spracherkennung als Klassifikation
0:20:20 Große Datenmengen, viele Klassen
0:23:29 Menschen können ASR
0:26:09 Ein Experiment
0:34:09 McGurk Effekt
0:38:10 Die Vogelperspektive
0:41:36 Gebiete, die relevant sind
0:46:03 Sprachproduktion
0:47:16 Artikulationsapparat
0:49:12 Vokaltrakt
0:50:46 Stimmhafte Sprache
0:54:51 Grundfrequenz/-ton
0:58:35 Animation des Vokaltrakts / Stroboskopaufnahme
1:01:27 Sprachlaute – Vokale und Konsonanten
1:05:36 Vokale
1:09:11 Diphthonge
1:10:37 Konsonanten
1:14:37 Konsonantenbeispiel
1:15:37 Ort der Artikulation
1:16:50 Art der Artikulation
1:21:30 Internationales Phonetisches Alphabet
1:22:43 IPA Vokale
1:23:43 IPA Konsonanten
1:25:00 Nasale
1:26:13 Phonem

Laufzeit (hh:mm:ss)

01:29:09

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17

Publiziert am

03.11.2016

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 98595 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 904694 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5349 s
Dateiname DIVA-2016-676_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 800006 bps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2016/17 Folgen 1-19 von 19