klanken vergelijken met informatietheorie

1. Analyse van spraaksignalen

1.1 Signaal transformaties

Analyse van spraaksignalen
  1. Startpunt: de amplitude van het signaal in functie van de tijd
  2. Omzetten naar het tijd-frequentie domein, de kleurcode komt overeen met het vermoden in het signaal
  3. Comprimeren van de frequentie-as; dit benadert de gevoeligheid van het menselijk oor
  4. Omzetten in Cepstra; het vergelijken van klanken kan eenvoudig door middel van een Euclidische aftand in deze ruimte

Tijdssignaal Tijd-frequentie plot (spectrogram) Tijd-frequnentie plot (compressie v/d freq. as) Cepstra
tijdssignaal tijd-frequentie (spectrogram) tijd-frequentie + compressie freq. as (MEL-spectrogram) Cepstrum

1.2 Effect van ruis

Invloed van ruis: een optelling van de ruis- en spraakenergie in the tijd-frequentie vlak
Tijdssignaal Tijd-frequentie plot (spectrogram) Tijd-frequnentie plot (compressie v/d freq. as) Cepstra
tijdssignaal tijd-frequentie (spectrogram) tijd-frequentie + compressie freq. as (MEL-spectrogram) Cepstrum

1.3 Effect van nagalam

De invloed van nagalm: links naar rechts uitsmering van de energie in het tijd-frequentie vlak.
Tijdssignaal Tijd-frequentie plot (spectrogram) Tijd-frequnentie plot (compressie v/d freq. as) Cepstra
tijdssignaal tijd-frequentie (spectrogram) tijd-frequentie + compressie freq. as (MEL-spectrogram) Cepstrum

2. Modelleren van basisklanken

2.1 Gaussian Mixture Models (GMM)

GMM

2.2 Het voorgestelde "sum-of-parts" model

NMF