KIT-Bibliothek

10: Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18, 27.11.2017

Autor

Sebastian Stüker

Herausgeber

KIT | Webcast

Beteiligtes Institut

Institut für Anthropomatik und Robotik (IAR)

Genre

Vorlesung

Beschreibung

  • 0:00:00 Starten
  • 0:00:20 Vektorquantisierung
  • 0:01:07 Voronoiregionen
  • 0:01:19 Mahalanobis Distanz
  • 0:01:39 Vektorquantisierung als Klassifikationsproblem
  • 0:02:14 K-Nächte Nachbar
  • 0:03:21 Beschleunigung von KNN
  • 0:15:21 Baumstruktur des Merkmalsraum
  • 0:16:20 Aufgabe
  • 0:26:15 Finden von Referenzvektoren
  • 0:26:56 K-Mittelwerte
  • 0:29:09 Learning VQ
  • 0:31:24 LVQ2, LVQ3
  • 0:32:53 LVQ als KNN
  • 0:37:13 Literaturempfehlung zu dieser Vorlesung
  • 0:38:45 Stochastik in der Spracherkennung
  • 0:46:57 Die Fundamentalformel
  • 0:53:27 Stochastische ASR Akustisches Modell
  • 0:54:33 Die Fundamentalformel
  • 0:56:21 Stochastischer Prozess
  • 1:06:03 Markow-Kette
  • 1:07:35 Markow-Kette n-ter Ordnung
  • 1:09:13 Markow-Ketten 1.Ordnung
  • 1:11:15 Homogene Makow-Ketten 1.Ordnung
  • 1:12:05 Beispiele
  • 1:19:44 Hidden Markov Models

Laufzeit (hh:mm:ss)

01:20:53

Serie

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18

Publiziert am

30.11.2017

Fachgebiet

Informatik

Lizenz

KITopen-Lizenz

Auflösung 1280 x 720 Pixel
Seitenverhältnis 16:9
Audiobitrate 101491 bps
Audio Kanäle 2
Audio Codec aac
Audio Abtastrate 48000 Hz
Gesamtbitrate 907456 bps
Farbraum yuv420p
Container mov,mp4,m4a,3gp,3g2,mj2
Medientyp video/mp4
Dauer 4853 s
Dateiname DIVA-2017-709_hd.mp4
Dateigröße 4.096 byte
Bildwiederholfrequenz 25
Videobitrate 799870 bps
Video Codec h264

Mediathek-URL

Embed-Code

Grundlagen der Automatischen Spracherkennung, Vorlesung, WS 2017/18 Folgen 1-23 von 23