Estimación del pitch en señales monofónicas de voz cantada

25
1 Grupo de Control y Procesamiento Digital de Señales Estimación del pitch en señales monofónicas de voz cantada Andrés Eduardo Coca Salazar Departamento de Música Universidad de Caldas Grupo de control y procesamiento digital de señale Universidad Nacional de Colombia Sede Manizales

Transcript of Estimación del pitch en señales monofónicas de voz cantada

Page 1: Estimación del pitch en señales monofónicas de voz cantada

1

Grupo de Control y Procesamiento Digital de Señales

Estimación del pitch en señales

monofónicas de voz cantada

Andrés Eduardo Coca Salazar

Departamento de MúsicaUniversidad de Caldas

Grupo de control y procesamiento digital de señalesUniversidad Nacional de Colombia

Sede Manizales

Page 2: Estimación del pitch en señales monofónicas de voz cantada

2

Grupo de Control y Procesamiento Digital de Señales

1. Introducción2. Algoritmos para la estimación del

pitch3. Marco experimental4. Resultados5. Conclusiones

Contenido

Page 3: Estimación del pitch en señales monofónicas de voz cantada

3

Grupo de Control y Procesamiento Digital de Señales

Planteamiento del problema

• La estimación del pitch para señales de voz cantada requieren de un tratamiento diferente al utilizado en la estimación para señales de voz hablada.

• Los algoritmos existentes para la estimación del pitch para señales de voz cantada se deben adecuar.

• Se deben crear algoritmos nuevos especiales para este tipo de señales.

Page 4: Estimación del pitch en señales monofónicas de voz cantada

4

Grupo de Control y Procesamiento Digital de Señales

Diferencias entre la voz cantada y la voz hablada

CantoHabla

Control del pitchPitch es involuntario

2 octavasMenos de una Octava

Oscila en una frecuencia media Intervalos musicales

Intensidad: 40-60dB Intensidad: hasta 120dB

Planteamiento del problema

Page 5: Estimación del pitch en señales monofónicas de voz cantada

5

Grupo de Control y Procesamiento Digital de Señales

Algoritmos para la estimación del pitch

• La vibración de las cuerdas vocales no necesariamente es periódica• Las transiciones de sonoridad• Ruidos acústicos de fondo

Errores típicos de la estimación

• Doble-pitch: La frecuencia es el doble de la esperada. Errores de octava.• Medios-pitch: La frecuencia es la mitad de la esperada.

Factores que dificultan la extracción

Tipos de estimación

TIEMPO

Forma de onda

FAC

Cepstral

FRECUENCIA

FFT

MIXTA

WT

Page 6: Estimación del pitch en señales monofónicas de voz cantada

6

Grupo de Control y Procesamiento Digital de Señales

Separación y acumulación armónica (SAA)

• Especial para aplicaciones musicales• Nombre de la nota musical y su numero de octava.• Se basa en la serie armónica. Análisis de Fourier de señales periódicas.

Escala de los armónicos

• Apropiado: Instrumentos de teclado y algunos de viento.

• No apropiados: Las voces y los instrumentos de cuerda. Frecuencias microtonalístas

Algoritmos para la estimación del pitch

Page 7: Estimación del pitch en señales monofónicas de voz cantada

7

Grupo de Control y Procesamiento Digital de Señales

Etapas del algoritmo SAA

Etapa para hallar el nombre de la nota

a

Algoritmos para la estimación del pitch

Se usa la escala cromática

Page 8: Estimación del pitch en señales monofónicas de voz cantada

8

Grupo de Control y Procesamiento Digital de Señales

Etapa para el valor de frecuencia

2

1240 55 4 .2

abf

a = # semitonosb = # de octava

Etapa para hallar el número de octava

b

Algoritmos para la estimación del pitch

Algoritmo SAA

Page 9: Estimación del pitch en señales monofónicas de voz cantada

9

Grupo de Control y Procesamiento Digital de Señales

12 señales musicales 6 octavas

Creación de las señales musicales para SAA

Energía más significativa

# # # # #E C C D D E F F G G AB A CB

1 1n n nn nE E E E maxn n n

Algoritmos para la estimación del pitch

6

1

2n nn

N t sen f t

12 nn if f 12110 2iif

Algoritmo SAA

Page 10: Estimación del pitch en señales monofónicas de voz cantada

10

Grupo de Control y Procesamiento Digital de Señales

• Se busca que posición ocupa el valor más significativo en la escala de los armónicos.• Primeros nueve armónicos de la serie sin repetir los que son iguales.

9DAcordes

Tónica:1 7 4 10 2n n n n

2 5 9 3 7n n n n

3 8 3 6 10n n n n

4 2 9 6 4n n n n

5ªJusta:

3ªM :

7ªm:

5

8

2

1,

2,

3,

4,

n

n

n

n

Búsqueda en la escala de los armónicos

Algoritmos para la estimación del pitch

Algoritmo SAA

Page 11: Estimación del pitch en señales monofónicas de voz cantada

11

Grupo de Control y Procesamiento Digital de Señales

Máxima verosimilitud (ML)

2 2 22 TE Y Y Y Y YY

ˆ min max TY E YY

Se busca en un conjunto de espectros ideales predefinidos el que mayor similitud tenga con el espectro de la trama de análisis.

Gran similitud Si el error de la diferencia es mínima

Cuando el producto es máximo

Algoritmos para la estimación del pitch

Page 12: Estimación del pitch en señales monofónicas de voz cantada

12

Grupo de Control y Procesamiento Digital de Señales

Representación gráfica

Diagrama en bloques

MIDI

Nota

Máxima verosimilitud (ML)

Algoritmos para la estimación del pitch

Page 13: Estimación del pitch en señales monofónicas de voz cantada

13

Grupo de Control y Procesamiento Digital de Señales

Algoritmo MLCreación de las señales musicales de prueba

Definir sistema de afinación usado Microtonalísmos

Algoritmos para la estimación del pitch

269 12 log12o

MIDI

fN

Nombre de la nota

Únicamente

12

Page 14: Estimación del pitch en señales monofónicas de voz cantada

14

Grupo de Control y Procesamiento Digital de Señales

61 1 2

i

if f

.6

1 1 , 2n

kknf f x x

1

cos 2N

nn

n s

fS t t h

f

Crear los valores

de frecuencia

Crear señales musicales

Corrección

2 1log log

log 2

F Fk

2

1

6

log

log 2

F

FN

Hallar número

de octavas

Hallar el númerode notas

Algoritmo MLCreación de las señales musicales de prueba

Algoritmos para la estimación del pitch

Page 15: Estimación del pitch en señales monofónicas de voz cantada

15

Grupo de Control y Procesamiento Digital de Señales

Marco experimental

Page 16: Estimación del pitch en señales monofónicas de voz cantada

16

Grupo de Control y Procesamiento Digital de Señales

Características de las muestras

Representación

en el pentagrama

Tabla con los registros musicales

Género Registro Ninf Nsup

FemeninoSoprano C4 A5

Mezzo-soprano B3 G5

Contralto G3 E5

Masculino

Tenor C3 A4

Barítono A2 F4

Bajo F2 D4

Marco experimental

Page 17: Estimación del pitch en señales monofónicas de voz cantada

17

Grupo de Control y Procesamiento Digital de Señales

Resultados

Page 18: Estimación del pitch en señales monofónicas de voz cantada

18

Grupo de Control y Procesamiento Digital de Señales

Resultados

Resultados en el dominio del tiempo

Separación y acumulación armónica (SAA)

Nombre nota y Nº Octava

C3 = 130,81 Hz

Tenor

Page 19: Estimación del pitch en señales monofónicas de voz cantada

19

Grupo de Control y Procesamiento Digital de Señales

Resultados en el dominio de la frecuencia

Resultados

Máxima verosimilitud (ML)

A3 = 220 Hz

Tenor

Page 20: Estimación del pitch en señales monofónicas de voz cantada

20

Grupo de Control y Procesamiento Digital de Señales

Resultados con señales de voz cantada

Primera frase del Introito del Réquiem en D menor K.626 de Mozart, sección de la contralto.

Tabla con las frecuencias

Algoritmo ML

Resultados

D4 C4 C♮4 B♭3 E4 A3 F4 F♯4 B♮3

293,66

277,18

261,62

233,08

329,63

220 349,23

369,99

246,94

Page 21: Estimación del pitch en señales monofónicas de voz cantada

21

Grupo de Control y Procesamiento Digital de Señales

Test de Kolmogorov-Smirnov Ho = igual distribución de probabilidad

ReferenciaEscala cromática

Análisis estadístico

Resultados

Método

= 0.05 = 0.01

SAA Rechaza Rechaza

ML No Rechaza

No Rechaza

Funciones de distribución acumulativa

Page 22: Estimación del pitch en señales monofónicas de voz cantada

22

Grupo de Control y Procesamiento Digital de Señales

Prueba de hipótesis

t - student

SNR = 20 dB

0 0rH X X

Resultados

Método = 0.05 = 0.01

SAA No rechaza No rechaza

ML No rechaza No rechaza

Prueba de inmunidad ante el ruido de fondo

Page 23: Estimación del pitch en señales monofónicas de voz cantada

23

Grupo de Control y Procesamiento Digital de Señales

CONCLUSIONES

• Los algoritmos ML y SAA, requieren de una afinación exacta de las señales musicales de entrada.

• El algoritmo SAA es muy sensible a los errores de octava, y presenta errores esporádicos en el resultado del nombre de la nota, se mejora aplicando la moda del vector.

Page 24: Estimación del pitch en señales monofónicas de voz cantada

24

Grupo de Control y Procesamiento Digital de Señales

Agradecimientos

• Héctor Fabio Torres C.• Ph.D Germán Castellanos• M.sc. Franklin A. Sepúlveda• GC & PDS

Page 25: Estimación del pitch en señales monofónicas de voz cantada

25

Grupo de Control y Procesamiento Digital de Señales

¿Preguntas?¿Preguntas?

Muchas gracias por su atención