KIT-Bibliothek
Audio-/Videodatei publizieren
Anleitung zum Publizieren

13: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 06.12.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

13 |
0:00:00 Starten
0:03:43 HMMs in ASR
0:04:40 Wortfolge zu HMM
0:06:02 HMM in ASR
0:16:53 HMM Trainingszyklus
0:23:06 Etikettierte Daten
0:30:58 Initialisierung mit K-Mittelwerte Algorithmus
0:32:36 Neutral Gas Algorithmus
0:35:38 Initialisierung der HMM Parameter
0:40:35 Initialisierung ohne Ettiketierte Daten
0:41:23 Viterbi Training
0:46:50 Label Training
0:47:39 Komponenten eines HMM Erkenners
0:49:11 Parameterkopplung
0:52:32 Semikontinuierliches HMM
0:57:24 Parameterkopplung
1:05:44 Parameterkopplung für GMMs
1:08:37 Kontextabhängige, akustische Modelierung
1:14:51 Spracheinheiten
1:15:50 Polyphone
1:17:25 Spracheinheiten
1:19:58 Cross Wort Polyphone
1:23:29 Positionsabhängige Polyphone

Laufzeit (hh:mm:ss)

01:25:56

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

07.12.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 100001 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 905901 kbps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5156 s
Dateiname DIVA-2017-761_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799805 kbps
Video Codec h264

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23