Energía sonora por fuera del rango audiblesaccom.org.ar/v2016/sites/default/files/23...
Transcript of Energía sonora por fuera del rango audiblesaccom.org.ar/v2016/sites/default/files/23...
Actas de ECCoM. Vol. 2 Nº 1, “La Experiencia Musical: Cuerpo, Tiempo y Sonido en el Escenario de Nuestra Mente. 12º ECCoM”. Isabel C. Martínez, Alejandro Pereira Ghiena, Mónica Valles y Matías Tanco (Editores). Buenos Aires: SACCoM. pp. 208-215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom
Registro de instrumentos musicales en alta resolución
Energía sonora por fuera del rango audible
Jorge Petrosino e Ianina Canalis
Universidad Nacional de Lanús
Resumen Según el conocimiento establecido en los libros de percepción y acústica, el límite máximo en frecuencia que el ser humano es capaz de percibir es cercano a los 20 kHz. El análisis espectral de los distintos instrumentos musicales se realiza en dicho rango de frecuencias, asumiendo de forma implícita que allí se concentra la totalidad de su energía sonora. En las últimas décadas se han publicado diversos trabajos que sugieren que en determinadas condiciones es posible percibir frecuencias superiores a los 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Por otra parte la existencia de formatos digitales de alta resolución de audio permite el registro de sonidos superando ampliamente dicho umbral. A pesar de estos resultados es difícil hallar trabajos con información sobre componentes de frecuencia de instrumentos musicales que exceden el rango audible tradicional. En este trabajo se presentan mediciones espectrales realizadas entre 20 Hz y 40 kHz de diferentes instrumentos musicales, enfocándonos en el análisis de aquellos que son utilizados en nuestra región. Nuestros resultados confirman la existencia de niveles significativos de energía en la zona de altas frecuencias.
Resumo De acordo com o conhecimento estabelecido nos livros relacionados à percepção e acústica, a frequência máxima que os seres humanos podem perceber é perto de 20 kHz. As medidas de análise espectral dos diferentes instrumentos musicais são feitas nessa faixa de freqüências, implicitamente assumindo que toda a energia do som é concentrada lá. Nas últimas décadas, vários estudos sugerindo que, sob certas condições, é possível perceber frequências acima de 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Além disso, os
formatos digitais alta resolução permitem a gravação de sons amplamente ultrapassando esse limiar. Apesar destes resultados, é difícil encontrar informações sobre os componentes de instrumentos musicais que vão além da área tradicional de distribuição de freqüências audíveis. Neste estudo medidas espectrais entre 20 Hz e 40 kHz de diferentes instrumentos musicais são apresentados. Enfatizando a análise daqueles que são usados em nossa região. Nossos resultados confirmam a existência de níveis significativos de energia nas altas freqüências.
Abstract According to the established knowledge in books about perception and acoustics, the maximum frequency that humans can perceive is close to 20 kHz. The spectral analysis of musical instruments is made in this range, implicitly assuming that their entire sound energy is concentrated in those frequencies. In recent decades, several studies have been published suggesting that under certain conditions it is possible to perceive frequencies above 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Moreover, the existence of high-resolution digital audio formats allow recording of sounds surpassing this threshold. Despite these results, it is difficult to find information on the frequency components of musical instruments that exceed the traditional audible range. In this paper we present spectral measurements of different musical instruments between 20 Hz and 40 kHz, focusing on the analysis of those instruments that are widely used in our region. Our results confirm the existence of significant levels of energy in the high frequencies.
Petrosino y Canalis p. 208 | 2015 | ISSN 2346-8874
Fundamentación
Los estudios sobre el análisis espectral de
instrumentos musicales que se encuentran
disponibles en libros y artículos académicos
cubren el rango de frecuencias que alcanza los
20 kHz. Prácticamente no hay datos dispo-
nibles sobre las características de los compo-
nentes de frecuencia que superen dicho
umbral. La única información que hemos
hallado al respecto ha sido generada por James
Boyk (1997) en un artículo con un sugestivo
título que afirma que existe vida por encima de
los 20 kHz. Boyk sostiene que en cada familia
de instrumentos musicales existe al menos un
miembro que produce energía hasta los 40 kHz
o más.
Resulta posible comprender esta falta de inte-
rés basándose en dos cuestiones principales.
Una referida a los límites de percepción respec-
to de esas altas frecuencias y la otra a las
características técnicas de la mayoría de los
sistemas de registro y reproducción del sonido
generado por los instrumentos musicales.
En las últimas décadas han sido publicados
algunos estudios que vuelven a poner en
cuestión los límites máximos de frecuencias
audibles.
Por una parte, se han llevado a cabo
experimentos utilizando tonos puros que
sugieren que es posible percibir frecuencias de
hasta 25 kHz con intensidades del orden de los
110 dB SPL (Ashihara, 2007; Canalis y
Petrosino, 2014).
En forma complementaria, los trabajos de
Oohashi (2000) y Nishiguchi (2007) sugieren
que las componentes ultrasónicas de determi-
nados sonidos compuestos pueden provocar
efectos perceptivos dando lugar a cierta acti-
vidad en la corteza cerebral diferente a la que
se produce cuando dichos componentes se
encuentran ausentes. Tanto Oohashi como
Nishiguchi han afirmado en sus trabajos que
ciertas personas que no son capaces de
percibir tonos puros de frecuencias elevadas
por encima del umbral de audición pueden sin
embargo detectar las diferencias al comparar la
presencia o ausencia de componentes ultra-
sónicos cuando estos están asociados a otros
componentes que se encuentran dentro del
rango audible.
Oohashi utilizó en sus primeros estudios
grabaciones de alta resolución de música
game-lán, argumentando que esa clase de
instrumentos musicales contienen una impor-
tante proporción de energía de alta frecuencia.
En dichos estudios publica diagramas espec-
trales de este tipo de instrumentos.
La posibilidad de distinguir entre registros de
sonido con frecuencias de muestreo elevadas
(Super Audio CD o DVD-Audio) comparadas
con muestreos de 48 kHz fue estudiada por
Meyer y Moran (2007). Sus conclusiones sugie-
ren que no es posible detectar entre la
reproducción de una muestra en 24 bits y 96
kHz y una versión de la misma muestra en 18
bits y 48 kHz. Sin embargo, el equipamiento
reportado en sus pruebas no permitía repro-
ducir frecuencias por encima del rango audible,
por lo que sus conclusiones no resultan nece-
sariamente incompatibles con los trabajos de
Oohashi.
Teniendo en cuenta la ausencia de información
completa y accesible sobre la energía sonora
en el rango ultrasónico de diferentes instru-
mentos musicales, los indicios de que en cier-
tos casos podrían percibirse componentes que
superan el rango audible tradiciones, sumado a
la disponibilidad actual de sistemas de registro
y reproducción del sonido en alta resolución
otorga sentido y fundamento a la realización de
un análisis comparativo de distintos instru-
mentos, incorporando algunos de uso típico en
nuestra región.
Objetivos
1. Obtener información que permita comparar
los espectros de emisión sonora de distintos
instrumentos musicales en un rango que se
extieenda hasta los 40 kHz, incluyendo
instrumentos de amplio uso en nuestra
región sobre los que no se poseen registros
espectrales ampliados
2. Determinar para cada instrumento analizado
la proporción de energía por encima de 20
kHz, comparada con el nivel de energía
sonora total.
Método
Registro de los instrumentos
seleccionados
Se realizaron registros de sonidos de charango,
bandoneón, acordeón, violín, saxo, piano,
bombo legüero y platillo. Las grabaciones fue-
p. 209 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom
ron realizadas con una placa de audio externa
con capacidad de registrar sonidos de hasta 45
kHz, teniendo especial cuidado en verificar que
esta capacidad incluyera todas las etapas
analógicas previas a la digitalización de las
muestras. La captura del sonido fue realizada
con un micrófono de medición Earthworks M-30
cuya respuesta es prácticamente plana hasta
los 30 kHz, llegando hasta los 40 kHz con una
caída de 3 dB.
En todos los casos se procedió al registro de
varios minutos con el micrófono ubicado a una
distancia de un metro del instrumento. Los
registros digitales se realizaron con una
frecuencia de muestreo de 96 kHz y una reso-
lución de 24 bits.
Cada grabación fue posteriormente analizada
utilizando software de edición de audio que
permitiese observar el espectro de las
grabaciones para detectar aquellos fragmentos
que pudieran tener mayor energía en alta
frecuencia. Se seleccionaron una o dos
muestras breves (menores a un segundo de
duración) de cada instrumento para la
comparación de espectros.
Análisis espectral
Con el fin de obtener resultados comparables a
las mediciones realizadas por Boyk (1997) se
decidió que las representaciones espectrales
fueran realizadas sobre secciones de 30
milisegundos, seleccionando para cada muestra
tres secciones consecutivas. En los instru-
mentos con un ataque impulsivo la primera de
estas secciones comienza con el ataque.
Los diagramas espectrales fueron obtenidos
con el analizador de espectro del software de
edición seleccionando la zona de interés
(secciones de 30 ms), utilizando una FFT de
1024 puntos y ventana de Blackman-Harris. La
Figura 1 corresponde al análisis espectral de
una muestra de sonido del charango.
Comparación de niveles de energía de
las secciones
Para obtener información sobre el nivel de
energía sonora total y poder comparalo con el
que corresponde solo a las altas frecuencias se
procesaron las muestras mediante el software
OCTAVE. Se utilizó una versión de cada
muestra conteniendo todas las frecuencias
(variable muestrasonora en el código de
OCTAVE), y se generó una nueva muestra
aplicando un filtro pasa altos con frecuencia de
corte de 24 kHz (variable muestrafiltrada en el
código). Se aplicaron las siguientes líneas de
código para realizar el cálculo de la proporción
entre energías:
>s30ms=0.03*fs; % número de muestras
corrrespondientes a 30 ms
>rms=sqrt(sum(muestrasonora(1:s30ms).^2)
/length(muestrasonora(1:s30ms)));
>rms_altafrec=sqrt(sum(muestrafiltrada(1:s30
ms).^2)/length(muestrafiltrada(1:s30ms)));
>proporcion= rms_altafrec/rms;
>dB=20*log10(proporcion);
Las medidas de proporción de energía se
realizaron en cuatro intervalos de tiempo: a)
entre 0 y 30 ms, b) entre 30 y 60 ms, c) entre
60 y 90 ms, y d) entre 0 y 100 ms. El instante
t=0 fue elegido variando los momentos de
inicio de la muestra hasta obtener la máxima
riqueza de altas frecuencias dentro de su desa-
rrollo. En varios casos este instante coincidió
con el ataque de la muestra.
Comparación del desarrollo temporal
de los niveles de energía
Con el fin de analizar la evolución de los
niveles de energía se procesaron las señales
mediante el OCTAVE para obtener un perfil de
niveles SPL equivalentes (asumiento una
referencia arbitraria). Se utilizó una función
disponible que realiza un diagrama temporal
del nivel SPL equivalente y se aplicó en forma
separada a la muestra de rango completo y a
la que sólo contenía alta frecuencia (Figura 3).
Petrosino y Canalis p. 210 | 2015 | ISSN 2346-8874
Figura 1. Espectro de una muestra de charango de 30 ms de duración a partir del ataque. La flecha indica el límite de audibilidad de 20 kHz.
Figura 2. Espectro de una muestra de charango con todas las frecuencias y de la misma muestra filtrada
p. 211 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom
Figura 3. Evolución temporal de energía de una muestra de charango conteniendo todas las frecuencias y de una versión de la misma muestra conteniendo solamente altas frecuencias
Instrumento Intervalo
0-30 ms
Intervalo
30-60ms
Intervalo
60-90 ms
Intervalo
0-100 ms
%
0- 100 ms
Platillo - 17.73 dB - 35.16 dB - 45.18 dB - 21.91 dB 8.2
Platillo y cadena - 25.34 dB - 36.65 dB - 40.75 dB - 28.98 dB 3.56
Charango a - 27.67 dB - 56.55 dB - 59.73 dB - 32.10 dB 2.48
Charango b - 31.62 dB - 59.33 dB - 64.32 dB - 35.21 dB 1.74
Acordeón a - 32.94 dB - 51.04 dB - 59.33 dB - 36.73 dB 1.46
Violin a -38.65 dB - 40.15 dB - 40.44 dB - 39.80 dB 1.02
Aro bombo legüero - 42.68 dB - 56.88 dB - 52.72 dB - 42.83 dB 0.72
Bandoneon a - 45.85 dB - 47.14 dB - 47.21 dB - 46.61 dB 0.47
Violin b - 48.62 dB - 49.25 dB - 48.36 dB - 48.99 dB 0.36
Acordeón b - 51.87 dB - 58.07 dB - 53.65 dB - 53.30 dB 0.22
Bandoneon b - 58.63 dB - 55.50 dB - 52.36 dB - 55.58 dB 0.17
Parche bombo legüero - 55.67 dB - 58.70 dB - 58.57 dB - 55.84 dB 0.16
Saxo - 63.74 dB - 64.25 dB - 65.78 dB - 64.67 dB 0.06
Bandoneon c - 65.99 dB - 66.18 dB - 66.66 dB - 65.71 dB 0.05
Piano - 70.24 dB - 76.12 dB - 73.04 dB - 72.47 dB 0.02
Tabla 1. Comparación de niveles de energía en alta frecuencia respecto de energía total
Petrosino y Canalis p. 212 | 2015 | ISSN 2346-8874
Resultados
Del análisis de la información espectral de
amplio rango de instrumentos musicales se ha
podido determinar que en gran parte de las
muestras existen proporciones significativas de
energía de alta frecuencias. Estos resultados
son consistentes con los estudios realizados
previamente por James Boyk (1997) en el
CalTech.
Nuestro aporte al análisis de Boyk ha sido la
incorporación de ciertos instrumentos de uso
local, como el charango, el acordeón, el
bandoneón y el bombo legüero. Por otra parte,
hemos ampliado las experiencias de Boyk
realizando diagramas de la evolución temporal
de la energía de altas frecuencias.
Proporción de energía en altas frecuencias
La Tabla 1 contiene los resultados de la
relación entre energía en altas frecuencias y
energía total de la muestra en los intervalos
temporales seleccionados: 0 a 30 ms, 30 a 60
ms, 60 a 90 ms y 0 a 100 ms. Las muestras se
han ordenado por valor decreciente de la
proporción de energía en altas frecuencias
respecto de la energía total.
Diagramas espectrales
Se incluyen los diagramas espectrales de
algunas muestras con gran proporción de
energía en altas frecuencias. Los espectros
mostrados corresponden a una sección de 30
ms de duración en la que se detecta gran
cantidad de armónicos de alta frecuencia.
En el diagrama espectral de los primeros 100
milisegundos del platillo (Figura 4) puede
observarse que el nivel promedio de energía en
el rango de frecuencia que se extiende de los
10 kHz a los 18 kHz es apenas unos 6 dB
superior al nivel promedio entre 22 kHz y 32
kHz.
En el diagrama espectral de la muestra de
charango (Figura 5), también de 100 ms, se
observan claramente picos equiespaciados en
frecuencia representando los armónicos. La
aparición de dichos picos se extiende a lo largo
de todo el rango de frecuencias analizado.
Existe una caída de nivel al superar al rango
audible, pero parte de esta caída se debe a que
las altas frecuencias del charango se producen
en el momento del ataque mientras que este
análisis espectral se realiza sobre 100 ms,
como puede observarse en el diagrama de la
evolución temporal del nivel de energía de la
Figura 9.
En el espectro representado del acordeón
(Figura 6) no se observa tan claramente la
presencia de picos correspondientes a los
armónicos cuando se compara esta figura con
la del charango o la del violín. De todas
maneras resulta interesante notar que la
pendiente de caída de nivel entre los 10 kHz y
los 38 kHz es suficientemente lenta.
El espectro del violín (Figura 7) muestra
claramente los armónicos. La pendiente de
caída de nivel entre los 16 kHz y los 34 kHz es
lenta.
Niveles de presión sonora comparados
Los siguientes diagramas muestran la
evolución temporal de los niveles de energía
total y de alta frecuencia presentados como
niveles de presión sonora comparados. El
análisis se realizó sobre secciones de 100 ms
de duración.
Puede notarse en la Figura 8 que el nivel de
energía de altas frecuencias del platillo en los
primeros milisegundos del ataque es
comparable al de la energía total y que decae a
un ritmo de unos 0.5 dB por milisegundo.
La energía de alta frecuencia de la muestra de
charango que se observa en la Figura 9 alcanza
en su máximo valor un nivel 15 dB por debajo
del nivel de energía total y registra un ritmo de
caída bastante abrupto cercano a 1.5 dB por
milisegundo.
La energía de alta frecuencia de la muestra de
acordeón llega a estar a unos 20 dB por debajo
del nivel de energía sonora total de la muestra
al momento del ataque, decayendo luego a un
ritmo de unos 0.6 dB por milisegundo.
En la muestra de violín el nivel de energía de
altas frecuencias muestra una diferencia que se
mantiene constante en el tiempo de alrededor
de 40 dB, lo que resulta consistente con el
mecanismo de generación de sonido por cuerda
frotada.
p. 213 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom
Figura 4. Espectro del ataque de un platillo de 100 ms de duración
Figura 5. Espectro del ataque de una muestra sonora de charango de 100 ms de duración
Figura 6. Espectro del ataque de una muestra sonora de acordeón de 100 ms de duración
Figura 7. Espectro del ataque de una muestra sonora de violín en una muestra de 100 ms.
Petrosino y Canalis p. 214 | 2015 | ISSN 2346-8874
Figura 8. Evolulción temporal de la energía del sonido de un platillo
Figura 9. Evolución temporal de la energía de una muestra sonora de charango
Figura 10. Evolución temporal de la energía de una muestra sonora de acordeón
Figura 11. Evolución temporal de una muestra sonora de violín
p. 215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom
Conclusiones
Existen indicios de que en determinadas
situaciones es posible percibir componentes de
frecuencias que superan el rango audible. Los
sistemas de grabación digitales actuales
permiten registrar dichos componentes. El
verdadero impacto que podría tener el registro
de estos componentes es aún objeto de
debate, pero resulta importante para ello
conocer con exactitud qué magnitud tiene
aquello que queda fuera de los registros.
Dado que se han detectado niveles de
información relevante por encima de los 20
kHz en instrumentos musicales, nuestro
trabajo podría brindar un aporte a la discusión
sobre el rango de frecuencias recomendable
para un registro sonoro fidedigno de
instrumentos musicales.
Agradecimientos
El presente trabajo se realizó en el marco del
proyecto 33A200 de la convocatoria Amílcar
Herrera 2014 de la Universidad Nacional de
Lanús.
Debemos agradecer a los instrumentistas que
nos permitieron realizar los registros utilizados
en este trabajo: Javier Acevedo (acordeón),
Leonel Gasso (bandoneón), Cristhian Faiad
(percusión), César Rago (violín), Federico
Jaureguiberry (saxo), Pablo Marconi (charango)
y Matías Pagliocca (piano).
Referencias
Ashihara, K. (2007). Hearing thresholds for pure tones above 16 kHz. Journal of the Acoustic Society of America, Vol. 122 N° 3, EL52-EL52
Boyk, J. (1997). There’s life above 20 kilohertz! A survey of musical instrument spectra to 102.4
kHz. En California Institute of Technology
(Caltech). Consultado el 24 de mayo de 2015 en <http://www. cco. caltech. edu/~ boyk/spectra/spectra. htm>
Canalis, I. y Petrosino, J. (2014). ¿Es posible percibir tonos puros por encima de los 20 kHz?
En P. Arenas (ed.) IX Congreso Iberoamericano de Acústica FIA2014. Valvidia: Universidad Austral de Chile, pp. 810-818
Meyer, E. y Moran, D. (2007). Audibility of a CD-Standard A/D/A Loop Inserted into High-Resolution Audio Playback. Journal of Audio Engineering Society, Vol. 55 N° 9, 775-779.
Nishiguchi, T. et al. (2009). Perceptual discrimi-
nation of very high frequency components in
wide frequency range musical sound. Applied Acoustics, Vol. 70 N° 7, 921-934.
Oohashi T. el al. (2000) Inaudible High-Frequency Sounds Affect Brain Activity: Hypersonic Effect. Journal of Neurophysiology. Vol. 83 N° 6, 3548-
3558.