KIT-Bibliothek
Audio-/Videodatei publizieren

23: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 07.02.2018

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:52 Inkrementelle Adaption
  • 0:03:12 Verschiedenes zu VTLN
  • 0:09:00 Maximum Likelihood Linear Regression (MLLR)
  • 0:18:25 Welche Adaption unter welchen Bedingungen?
  • 0:21:27 Erinnerung MLLR
  • 0:28:39 Bottleneck Features
  • 0:33:48 Acoustic Model: Neural networks
  • 0:41:07 Time-delay neural networks (TDNN)
  • 0:47:31 Speaker adaptive neural networks
  • 0:55:34 Neural network training: Potential problems?
  • 1:05:53 Connectionist temporal classification (CTC)
  • 1:23:21 Reaching "human parity"

Laufzeit (hh:mm:ss)

01:32:33

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

08.02.2018

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 128000 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 915340 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 5553 s
Dateiname DIVA-2018-167_hd.mp4
Dateigröße 635.358.027 byte
Bildwiederholfrequenz 25
Videobitrate 781243 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23