Estimación y Seguimiento de los Formantes de la Voz Humana...
Transcript of Estimación y Seguimiento de los Formantes de la Voz Humana...
![Page 1: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/1.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Estimacion y Seguimiento de los Formantes de laVoz Humana
Tratamiento Estadıstico de Senales 2010
Pablo A. Iturralde, Rodrigo L. Rosa
August 20, 2011
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 2: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/2.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Agenda...
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 3: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/3.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 4: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/4.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Introduccion
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 5: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/5.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
Figure: Sonidos sonoros.
� Sonidos sonoros:
• Caracterıstica tonal
• Forma de onda: Periodica
• La cuerdas vocales vibran
• Ejemplos: Vocales, sonidosnasales (’n’,’m’).
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 6: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/6.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
Figure: Sonidos sonoros.
� Sonidos sonoros:
• Caracterıstica tonal
• Forma de onda: Periodica
• La cuerdas vocales vibran
• Ejemplos: Vocales, sonidosnasales (’n’,’m’).
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 7: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/7.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
Figure: Sonidos sonoros.
� Sonidos sonoros:
• Caracterıstica tonal
• Forma de onda: Periodica
• La cuerdas vocales vibran
• Ejemplos: Vocales, sonidosnasales (’n’,’m’).
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 8: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/8.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
Figure: Sonidos sonoros.
� Sonidos sonoros:
• Caracterıstica tonal
• Forma de onda: Periodica
• La cuerdas vocales vibran
• Ejemplos: Vocales, sonidosnasales (’n’,’m’).
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 9: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/9.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
Figure: Sonidos sonoros.
� Sonidos sonoros:
• Caracterıstica tonal
• Forma de onda: Periodica
• La cuerdas vocales vibran
• Ejemplos: Vocales, sonidosnasales (’n’,’m’).
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 10: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/10.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Sonidos sordos
Figure: Sonidos sordos: ’s’,’f ’, etc.
� Sonidos sordos:
• Forma de onda:Pseudo-aleatoria (ruido).
• Las cuerdas vocales novibran.
• Ejemplos: Fricativas:’s’,’f’,etc.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 11: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/11.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Sonidos sordos
Figure: Sonidos sordos: ’s’,’f ’, etc.
� Sonidos sordos:
• Forma de onda:Pseudo-aleatoria (ruido).
• Las cuerdas vocales novibran.
• Ejemplos: Fricativas:’s’,’f’,etc.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 12: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/12.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Sonidos sordos
Figure: Sonidos sordos: ’s’,’f ’, etc.
� Sonidos sordos:
• Forma de onda:Pseudo-aleatoria (ruido).
• Las cuerdas vocales novibran.
• Ejemplos: Fricativas:’s’,’f’,etc.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 13: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/13.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Sonidos sordos
Figure: Sonidos sordos: ’s’,’f ’, etc.
� Sonidos sordos:
• Forma de onda:Pseudo-aleatoria (ruido).
• Las cuerdas vocales novibran.
• Ejemplos: Fricativas:’s’,’f’,etc.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 14: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/14.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Sonidos sonoros
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 15: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/15.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Fonemas
Fonemas: Clase de equivalencia de sonidos.
(a) Vocal O (b) Vocal U
� Picos en el espectro de un fonema→ Frecuencias de resonancia del tracto vocal.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 16: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/16.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Fonemas
Fonemas: Clase de equivalencia de sonidos.
(a) Vocal O (b) Vocal U
� Picos en el espectro de un fonema→ Frecuencias de resonancia del tracto vocal.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 17: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/17.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Fonemas
Fonemas: Clase de equivalencia de sonidos.
(a) Vocal O (b) Vocal U
� Picos en el espectro de un fonema→ Frecuencias de resonancia del tracto vocal.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 18: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/18.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Fonemas
Fonemas: Clase de equivalencia de sonidos.
(a) Vocal O (b) Vocal U
� Picos en el espectro de un fonema→ Frecuencias de resonancia del tracto vocal.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 19: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/19.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
� Tecnicas de estimacion→ Linear Predictive Coding :
• Autocorrelacion
• Covarianza
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 20: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/20.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo
� Tecnicas de estimacion→ Linear Predictive Coding :
• Autocorrelacion
• Covarianza
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 21: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/21.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
La Voz Humana: Modelo
La Voz Humana: Modelo Matematico
Figure: (a) Frecuencia. (b) Tiempo.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 22: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/22.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 23: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/23.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 24: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/24.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 25: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/25.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 26: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/26.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 27: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/27.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 28: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/28.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 29: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/29.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Modelo:
sn = −p∑
k=1
aksn−k +Gun
� Objetivo:→ Determinar ak & G.
� Hipotesis:
• Estacionaridad• un desconocida
� Estimacion:
sn = −p∑
k=1
aksn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 30: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/30.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Estimacion:
sn = −p∑
k=1
aksn−k
� Error:
en = sn − sn
= sn +
p∑k=1
aksn−k
� Procedimiento:→ Minimizar el errorcuadratico total medianteMC :
Ep =∑n
s2n+
p∑k=1
ak∑n
snsn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 31: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/31.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Estimacion:
sn = −p∑
k=1
aksn−k
� Error:
en = sn − sn
= sn +
p∑k=1
aksn−k
� Procedimiento:→ Minimizar el errorcuadratico total medianteMC :
Ep =∑n
s2n+
p∑k=1
ak∑n
snsn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 32: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/32.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Estimacion:
sn = −p∑
k=1
aksn−k
� Error:
en = sn − sn
= sn +
p∑k=1
aksn−k
� Procedimiento:→ Minimizar el errorcuadratico total medianteMC :
Ep =∑n
s2n+
p∑k=1
ak∑n
snsn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 33: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/33.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Estimacion:
sn = −p∑
k=1
aksn−k
� Error:
en = sn − sn
= sn +
p∑k=1
aksn−k
� Procedimiento:→ Minimizar el errorcuadratico total medianteMC :
Ep =∑n
s2n+
p∑k=1
ak∑n
snsn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 34: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/34.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
LPC : Linear Predictive Coding
� Estimacion:
sn = −p∑
k=1
aksn−k
� Error:
en = sn − sn
= sn +
p∑k=1
aksn−k
� Procedimiento:→ Minimizar el errorcuadratico total medianteMC :
Ep =∑n
s2n+
p∑k=1
ak∑n
snsn−k
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 35: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/35.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion
Autocorrelacion
Def.:
R(i) =
∞∑n=−∞
snsn+i
Ecuacion a resolver:
Ep = R(0) +
p∑k=1
akR(k)
→ Matriz para MC:
Mi,k = R(i− k)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 36: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/36.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion
Autocorrelacion
Def.:
R(i) =
∞∑n=−∞
snsn+i
Ecuacion a resolver:
Ep = R(0) +
p∑k=1
akR(k)
→ Matriz para MC:
Mi,k = R(i− k)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 37: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/37.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion
Autocorrelacion
Def.:
R(i) =
∞∑n=−∞
snsn+i
Ecuacion a resolver:
Ep = R(0) +
p∑k=1
akR(k)
→ Matriz para MC:
Mi,k = R(i− k)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 38: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/38.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Covarianza
Covarianza
Def.:
ϕki =
N−1∑n=0
sn−ksn−i
Ecuacion a resolver:
Ep = ϕ00 +
p∑k=1
akϕ0k
→ Matriz para MC:Mi,k = ϕki
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 39: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/39.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Covarianza
Covarianza
Def.:
ϕki =
N−1∑n=0
sn−ksn−i
Ecuacion a resolver:
Ep = ϕ00 +
p∑k=1
akϕ0k
→ Matriz para MC:Mi,k = ϕki
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 40: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/40.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Covarianza
Covarianza
Def.:
ϕki =
N−1∑n=0
sn−ksn−i
Ecuacion a resolver:
Ep = ϕ00 +
p∑k=1
akϕ0k
→ Matriz para MC:Mi,k = ϕki
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 41: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/41.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 42: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/42.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 43: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/43.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 44: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/44.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 45: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/45.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 46: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/46.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 47: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/47.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Autocorrelacion Vs. Covarianza
Autocorrelacion (corr) o covarianza (cov)?
Autocorrelacion CovarianzaMatriz Toeplitz SimetricaCosto Computacional Menor Mayor# Muestras N p+NEnvantanado No...? NoSesgo Si No
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 48: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/48.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Tamano de Ventana
./A_L.wav
Figure: Ventana de 256 muestras.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 49: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/49.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Tamano de ventana
./A_L.wav
Figure: Ventana: 512 muestras.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 50: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/50.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Tamano de ventana
./A_L.wav
Figure: Ventana: 1024 muestras.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 51: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/51.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Eleccion del tamano de ventana y el metodo
Tamano de ventana & modelo estacionario
� Senales de voz: Abarcar 2 periodos de la senal
• Ventanas de entre 256 y 2048 muestras.
Criterios para la eleccion del metodo:
� Si [es posible tomar ventanas de tamano suficiente] entoncescorr, sino cov
� Si [la capacidad computacional es limitada] entonces corr, sinocov
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 52: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/52.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Eleccion del tamano de ventana y el metodo
Tamano de ventana & modelo estacionario
� Senales de voz: Abarcar 2 periodos de la senal
• Ventanas de entre 256 y 2048 muestras.
Criterios para la eleccion del metodo:
� Si [es posible tomar ventanas de tamano suficiente] entoncescorr, sino cov
� Si [la capacidad computacional es limitada] entonces corr, sinocov
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 53: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/53.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Eleccion del tamano de ventana y el metodo
Tamano de ventana & modelo estacionario
� Senales de voz: Abarcar 2 periodos de la senal
• Ventanas de entre 256 y 2048 muestras.
Criterios para la eleccion del metodo:
� Si [es posible tomar ventanas de tamano suficiente] entoncescorr, sino cov
� Si [la capacidad computacional es limitada] entonces corr, sinocov
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 54: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/54.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Eleccion del tamano de ventana y el metodo
Tamano de ventana & modelo estacionario
� Senales de voz: Abarcar 2 periodos de la senal
• Ventanas de entre 256 y 2048 muestras.
Criterios para la eleccion del metodo:
� Si [es posible tomar ventanas de tamano suficiente] entoncescorr, sino cov
� Si [la capacidad computacional es limitada] entonces corr, sinocov
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 55: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/55.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Eleccion del tamano de ventana y el metodo
Tamano de ventana & modelo estacionario
� Senales de voz: Abarcar 2 periodos de la senal
• Ventanas de entre 256 y 2048 muestras.
Criterios para la eleccion del metodo:
� Si [es posible tomar ventanas de tamano suficiente] entoncescorr, sino cov
� Si [la capacidad computacional es limitada] entonces corr, sinocov
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 56: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/56.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Eleccion del tamano de ventana y el metodo
Tamano de ventana & modelo estacionario
� Senales de voz: Abarcar 2 periodos de la senal
• Ventanas de entre 256 y 2048 muestras.
Criterios para la eleccion del metodo:
� Si [es posible tomar ventanas de tamano suficiente] entoncescorr, sino cov
� Si [la capacidad computacional es limitada] entonces corr, sinocov
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 57: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/57.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Orden del Filtro
./A_L.wav
Figure: Autocorrelacion + Rectangular - Ventana: 512 muestrasPablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 58: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/58.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Orden del Filtro
./A_L.wav
Figure: Autocorrelacion + Hanning - Ventana: 512 muestrasPablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 59: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/59.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Orden del Filtro
./A_L.wav
(a) Rectangular window. (b) Hanning window.
Figure: Autocorrelacion - Ventana: 512 muestras
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 60: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/60.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Autocorrelacion Vs. Covarianza
Orden del Filtro
./A_L.wav
Figure: Covarianza - Ventana: 512 muestrasPablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 61: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/61.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 62: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/62.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 63: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/63.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 64: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/64.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 65: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/65.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 66: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/66.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 67: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/67.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 68: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/68.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 69: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/69.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 70: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/70.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 71: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/71.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Visual Vocal Tract Resonance
Idea:
� Para c/ventana wi:
• LPC→ Polos pi del filtro→ Candidatos
• Polos de banda ancha→ Se descartan.
� Recorrer [wi, pi]
• Si un frecuencia serepite→ Kalman.
Figure: Algoritmo VVTR
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 72: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/72.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Ejemplo: VVTR a una vocal
./E_L.wav
Figure: Seguimiento de formantes en E L.wav
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 73: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/73.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Generacion de candidatos
1 LPC de cada ventana mediante corr o cov→ Polos: Candidatos a frecuencias de resonancia
(formantes).→ Solo si tienen ancho de banda menor a 400Hz
(a) Ventana a analizar (b) LPC (Covarianza)Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 74: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/74.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Generacion de candidatos
1 LPC de cada ventana mediante corr o cov→ Polos: Candidatos a frecuencias de resonancia
(formantes).→ Solo si tienen ancho de banda menor a 400Hz
(a) Ventana a analizar (b) LPC (Covarianza)Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 75: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/75.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Generacion de candidatos
1 LPC de cada ventana mediante corr o cov→ Polos: Candidatos a frecuencias de resonancia
(formantes).→ Solo si tienen ancho de banda menor a 400Hz
(a) Ventana a analizar (b) LPC (Covarianza)Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 76: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/76.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Maquina de estados
2 Iniciar/terminar trayectorias.
Figure: Maquina de estados del algoritmo VVTR.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 77: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/77.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 78: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/78.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 79: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/79.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 80: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/80.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 81: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/81.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 82: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/82.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 83: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/83.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 84: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/84.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 85: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/85.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR: Innovacion
3 Asociar candidatos con frecuencias yaexistenes.
� Opciones:
• Ancho de banda constante.• Ancho de banda variable→ Mayor complejidad, resultadossimilares...
� Estrategia:
• Prioridad para frequencies bajoseguimiento
• Conflictos: Nearest neighbor.
→ No es optimo globalmente.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 86: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/86.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR - Kalman
4 Kalman� Ecuaciones:
xk = Axk−1 +Gwk−1
yk = Hxk + vk
A =
[1 T0 1
]G =
[T 2
2T
]H =
[1 0
]� Vector de estados:
xk =
[Fk
Fk
]Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 87: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/87.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR - Kalman
4 Kalman� Ecuaciones:
xk = Axk−1 +Gwk−1
yk = Hxk + vk
A =
[1 T0 1
]G =
[T 2
2T
]H =
[1 0
]� Vector de estados:
xk =
[Fk
Fk
]Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 88: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/88.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR - Kalman
4 Kalman� Ecuaciones:
xk = Axk−1 +Gwk−1
yk = Hxk + vk
A =
[1 T0 1
]G =
[T 2
2T
]H =
[1 0
]� Vector de estados:
xk =
[Fk
Fk
]Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 89: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/89.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
VVTR - Kalman
4 Kalman� Ecuaciones:
xk = Axk−1 +Gwk−1
yk = Hxk + vk
A =
[1 T0 1
]G =
[T 2
2T
]H =
[1 0
]� Vector de estados:
xk =
[Fk
Fk
]Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 90: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/90.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 91: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/91.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Reconocimiento de vocales - Caracterizacion
VVTR→ Con dos frecuencias es posible caracterizar a una vocal.
Table: Fingerprints
Formantes F1 F2
A 730 1300E 440 2000I 270 2300O 460 800U 280 750
Resultados:
� 88% de exito sobre una base de datos de 15 usuarios.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 92: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/92.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Reconocimiento de vocales - Caracterizacion
VVTR→ Con dos frecuencias es posible caracterizar a una vocal.
Table: Fingerprints
Formantes F1 F2
A 730 1300E 440 2000I 270 2300O 460 800U 280 750
Resultados:
� 88% de exito sobre una base de datos de 15 usuarios.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 93: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/93.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Reconocimiento de vocales - Caracterizacion
VVTR→ Con dos frecuencias es posible caracterizar a una vocal.
Table: Fingerprints
Formantes F1 F2
A 730 1300E 440 2000I 270 2300O 460 800U 280 750
Resultados:
� 88% de exito sobre una base de datos de 15 usuarios.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 94: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/94.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Reconocimiento de vocales - Caracterizacion
VVTR→ Con dos frecuencias es posible caracterizar a una vocal.
Table: Fingerprints
Formantes F1 F2
A 730 1300E 440 2000I 270 2300O 460 800U 280 750
Resultados:
� 88% de exito sobre una base de datos de 15 usuarios.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 95: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/95.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Reconocimiento de Vocales: Mapa de formantes
Figure: Particion 2D generada por la metrica utilizada.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 96: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/96.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Reconocimiento de Vocales
./A_L.wav
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 97: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/97.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 98: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/98.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Modelo: SX(z) = HX(z)UT imbreDeV oz(z)
Idea:
� LPC : → Respuesta en frecuencia de cada vocal.
SX(z) = HX(z)UT imbreDeV oz(z)
� Filtrado inverso → Timbre de voz.
UT imbreDeV oz(z) =SX(z)
HX(z)Aplicacion:
� Sıntesis a partir del timbre de voz y de la respuesta en frecuenciatıpica de cada vocal:
SY (z) = HY (z)UT imbreDeV oz(z)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 99: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/99.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Modelo: SX(z) = HX(z)UT imbreDeV oz(z)
Idea:
� LPC : → Respuesta en frecuencia de cada vocal.
SX(z) = HX(z)UT imbreDeV oz(z)
� Filtrado inverso → Timbre de voz.
UT imbreDeV oz(z) =SX(z)
HX(z)Aplicacion:
� Sıntesis a partir del timbre de voz y de la respuesta en frecuenciatıpica de cada vocal:
SY (z) = HY (z)UT imbreDeV oz(z)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 100: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/100.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Modelo: SX(z) = HX(z)UT imbreDeV oz(z)
Idea:
� LPC : → Respuesta en frecuencia de cada vocal.
SX(z) = HX(z)UT imbreDeV oz(z)
� Filtrado inverso → Timbre de voz.
UT imbreDeV oz(z) =SX(z)
HX(z)Aplicacion:
� Sıntesis a partir del timbre de voz y de la respuesta en frecuenciatıpica de cada vocal:
SY (z) = HY (z)UT imbreDeV oz(z)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 101: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/101.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Modelo: SX(z) = HX(z)UT imbreDeV oz(z)
Idea:
� LPC : → Respuesta en frecuencia de cada vocal.
SX(z) = HX(z)UT imbreDeV oz(z)
� Filtrado inverso → Timbre de voz.
UT imbreDeV oz(z) =SX(z)
HX(z)Aplicacion:
� Sıntesis a partir del timbre de voz y de la respuesta en frecuenciatıpica de cada vocal:
SY (z) = HY (z)UT imbreDeV oz(z)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 102: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/102.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Modelo: SX(z) = HX(z)UT imbreDeV oz(z)
Idea:
� LPC : → Respuesta en frecuencia de cada vocal.
SX(z) = HX(z)UT imbreDeV oz(z)
� Filtrado inverso → Timbre de voz.
UT imbreDeV oz(z) =SX(z)
HX(z)Aplicacion:
� Sıntesis a partir del timbre de voz y de la respuesta en frecuenciatıpica de cada vocal:
SY (z) = HY (z)UT imbreDeV oz(z)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 103: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/103.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Modelo: SX(z) = HX(z)UT imbreDeV oz(z)
Idea:
� LPC : → Respuesta en frecuencia de cada vocal.
SX(z) = HX(z)UT imbreDeV oz(z)
� Filtrado inverso → Timbre de voz.
UT imbreDeV oz(z) =SX(z)
HX(z)Aplicacion:
� Sıntesis a partir del timbre de voz y de la respuesta en frecuenciatıpica de cada vocal:
SY (z) = HY (z)UT imbreDeV oz(z)
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 104: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/104.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
./timbre_L.wav a partir de ./A_L.wav
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 105: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/105.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Sıntesis basada en:
./A_L.wav
Audio sintetizado./synt_1_L.wav [A]
./synt_2_L.wav [E]
./synt_3_L.wav [I]
./synt_4_L.wav [O]
./synt_5_L.wav [U]
Audio original./A_L.wav: [A]
./E_L.wav: [E]
./I_L.wav: [I]
./O_L.wav: [O]
./U_L.wav: [U]
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 106: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/106.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Aplicacion: Sıntesis de Vocales
Sıntesis basada en:
./A_L.wav
Audio sintetizado./synt_1_L.wav [A]
./synt_2_L.wav [E]
./synt_3_L.wav [I]
./synt_4_L.wav [O]
./synt_5_L.wav [U]
Audio original./A_L.wav: [A]
./E_L.wav: [E]
./I_L.wav: [I]
./O_L.wav: [O]
./U_L.wav: [U]
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 107: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/107.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
Trabajo a futuro
� Aplicacion: Reconocimiento de vocales
• Mejorar la extraccion de caracterısticas (2 formantes porvocal): considerar varianza, ancho de banda de los polos.
• Considerar que hacer cuando solo se reconoce una frecuenciamediante VVTR.
• Mejorar clasificador: actualmente es el mınimo de una metricaeuclideana ponderada.
• Extender reconocimiento a fonemas no vocales.
• Segmentar audio complejo (actualmente se trabaja confonemas puros) e intentar reconocimiento de fonemas.
� Nueva aplicacion: reconocimiento de timbres vocales.
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 108: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/108.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
END
A jugar con sint show.m?
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 109: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/109.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
END
A jugar con sint show.m?
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 110: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/110.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
1 IntroduccionLa Voz Humana: Modelo
2 LPC: Linear Predictive CodingAutocorrelacionCovarianzaAutocorrelacion Vs. Covarianza
3 VVTR: Visual Vocal Tract Resonance
4 Reconocimiento de Vocales
5 Sıntesis de Vocales
6 References
Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana
![Page 111: Estimación y Seguimiento de los Formantes de la Voz Humana ...iie.fing.edu.uy/ense/asign/tes/monografias/2010/iturralde-rosa/presentacion.pdf · Pablo A. Iturralde, Rodrigo L. Rosa](https://reader031.fdocumento.com/reader031/viewer/2022041905/5e62ee5240c13b526e0733ac/html5/thumbnails/111.jpg)
Introduccion LPC: Linear Predictive Coding VVTR: Visual Vocal Tract Resonance Reconocimiento de Vocales Sıntesis de Vocales References
References
J. Makhoul. Linear prediccion: A tutorial review. Proceedings of theIEEE, VOL. 63, NO. 4, APRIL 1975.Anthony Zaknich. Principles of adaptive filters and self-learningsystems. ISBN-10:1852339845.
Jan S. Erkelens and Piet M. T. Broersen. Bias Propagacion in theAutocorrelacion Method of Linear Prediccion. IEEE Transaccions onSpeech and Audio Processing, VOL. 5, NO. 2, MARCH 1997.
I. Yocel 0zbek, Mobeccel Demirekler. Tracking of Visible Vocal TractResonances (VVTR) Based on Kalman Filtering.
W. Klein, R. Plomp, and L.C. Pols, Vowel spectra, vowel spaces, andvowel identificacion. The Journal of the Acoustical Society ofAmerica, vol. 48, 1970, pp. 999-1009.
A. Cohen, C.J. Ebeling, K. Fokkema, A.G.F. van Holk. Fonologie
van het Nederlands en het Fries. Martinus Nijhoff, s-Gravenhage,
1962. 2nd Ed.Pablo A. Iturralde, Rodrigo L. Rosa
Estimacion y Seguimiento de los Formantes de la Voz Humana