Sobre escucha binaural y tridimensionalidad en el sonido

Iniciado por Benedetti, 27 de Enero de 2011, 09:21:49 AM

Tema anterior - Siguiente tema

0 Usuarios y 1 Visitante están viendo este tema.

Benedetti

El propósito de este hilo es explicar los mecanismos que operan en la audición humana con el fin de recrear la tridimensionalidad en el sonido. Éste post no persigue utilidad práctica alguna, lo escribo con finalidad meramente informativa, para los interesados en ampliar conocimientos (especialmente los usuarios Prom y Kalin, que lo han pedido).

En éste primer post abordaremos los parámetros físicos que permiten la percepción de la tridimensionalidad (estos son: intensidad, fase y longitud de onda), mientras que en el segundo post pasaré a describir los fenómenos psicoacústicos involucrados (es decir: efecto Haas y enmascaramiento sonoro). El tercer y último post repasa todas las situaciones en las cuales se pueden efectuar cambios en la percepción espacial del sonido, desde la sala de grabación hasta la escucha final, y las principales técnicas empleadas para lograrlo. Empezamos.


Tridimensionalidad en sonido directo: diferencias de intensidad y de fase

Antes de la explicación conviene aclarar dos conceptos.

- Intensidad sonora es "lo fuerte" que se escucha un determinado sonido.

- Fase es la diferencia de tiempo entre la llegada de un sonido a un oído y a otro.

Nuestro cerebro dispone de dos mecanismos principales para localizar espacialmente un sonido:

- Detectar diferencias de intensidad para altas frecuencias.

- Detectar diferencias de fase (decalaje) para bajas frecuencias.

No es posible detectar diferencias de intensidad en frecuencias bajas ni desfase en frecuencias altas. ¿Por qué? Por la misma física del sonido.

A la hora de averiguar la procedencia de un sonido, nuestro cerebro sopesará la información que le llega de ambos oídos. Comparará la diferencia de intensidades y el desfase temporal y en base a esos datos inferirá la procedencia del sonido.

¿A qué se debe el retardo temporal? Sencillamente, a que la distancia entre la fuente sonora y cada uno de nuestros oídos no es nunca la misma, salvo que la fuente esté centrada. Como consecuencia, las ondas sonoras recorren un trayecto más largo para alcanzar un oído que el otro. Nuestro cerebro es capaz de inferir la la ubicación de la fuente calculando la distancia recorrida por el sonido para cada oído a partir del retardo en la llegada de la onda a uno y a otro. Una vez hecho ésto, solo tiene que triangular la posición de la fuente a partir de la información recibida de ambos oídos y la separación horizontal entre oídos (el tamaño de la cabeza), considerada constante. Éste procedimiento es especialmente eficaz para detectar sonidos producidos por impulso, como por ejemplo una explosión. Lamentablemente, nuestro oído no puede usar este procedimiento para detectar con eficacia sonidos por encima de los 800 Hz. ¿Por qué?

La longitud de onda se considera una constante universal, y es proporcional a la frecuencia. Los sonidos por encima de 800 Hz se corresponden con longitudes de onda pequeñas (inferiores a los 30 cm), por tanto, inferiores al ancho de nuestra cabeza. Ésto hace que solo sean escuchados por uno de los dos oídos, puesto que la cabeza funciona como una pantalla relativa que, dependiendo del ángulo de incidencia, puede impedir totalmente que el sonido alcance el oído opuesto a la ubicación de la fuente. De tal forma, con frecuencias altas no puede detectarse desfase, puesto que el sonido no llega eficazmente a ambos oídos.

¿Y qué pasa con la intensidad? Las ondas de sonido actúan sobre el aire, que es un fluido viscoso, comprimiéndolo y expandiéndolo localmente. El valor de éstas sobrepresiones locales, medido en dB, es lo que llamamos intensidad del sonido. A mayor presión, más fuerte se escucha el sonido. La siguiente imagen, extraida de la wiki inglesa, representa el pulso de presión ocasionado por las ondas longitudinales (aire) y transversales (sólidos) respectivamente. Podemos observar cómo se originan sobrepresiones locales cuando el aire es atravesado por el sonido.

            


Entendiendo que el modelo de propagación de la onda es esférico, y que la presión se reparte de forma homogénea a lo largo de toda la superficie de la onda, la presión disminuirá paulatinamente al aunentar el radio de la misma. Ésta disminución es proporcional al cuadrado del radio, es decir, a la distancia recorrida (ley de la inversa del cuadrado), de tal forma que cuanto más lejos estemos, más tenue se va a oír el sonido. De todo esto deducimos que existe una pérdida de intensidad proporcional a la distancia recorrida por la onda.

Por tanto, podemos concluir que la intensidad de un sonido disminuye al aumentar la distancia. Al igual que pasa con el desfase, nuestro cerebro puede calibrar las diferencias de intensidad entre el sonido recibido por ambos oídos para deducir la ubicación de la fuente sonora. El problema es que las diferencias de intensidad son cada vez menores cuanto más baja sea la frecuencia. Así, por ejemplo, la diferencia de intensidad entre oídos puede llegar a ser de +30 dB a 10.000 Hz, mientras que es prácticamente inexistente a 250 Hz.

En general, convenimos que para el oído humano no es posible detectar diferencias de intensidad en sonidos de menos de 1000 Hz ni diferencias de fase por encima de los 800 Hz. ¿Que pasa entonces entre los 800 Hz y los 1000 Hz? Que interpolamos.

* Inciso: muchas personas no tiene una noción clara de qué significan "x" Hz. Voy a intentar poner sonido a estos datos: 250 Hz se corresponden con la voz de un varón hablando; 1000 Hz equivalen a la frecuencia del DO6 (el Do de pecho de las sopranos, esa nota tan aguda que dan al final de las arias) y 800 Hz es la frecuencia de esa misma soprano cantando cinco notas más abajo, ¿OK?

Una vez llegados a éste punto es importante establecer tres matices sobre lo dicho:

- Primero, éstas capacidades dependen puramente de principios físicos y son por tanto idénticas para todos los humanos. La variable común a todas ellas, como habréis podido averiguar, es la separación entre orejas. O lo que es lo mismo, el tamaño de la cabeza. A más grande la cabeza, mayor capacidad para localizar la procedencia del sonido.

- En segundo lugar, éstas capacidades son aplicables esencialmente al plano horizontal. Nuestra habilidad para percibir la dirección de un sonido sobre el eje vertical es muy mala, pues nuestros dos oídos se hallan muy alineados sobre la horizontal. Por eso, cuando escuchamos música, notamos algunas cosas lejos y otras cerca, unas a la izquierda y otras a la derecha, pero raramente oímos algo arriba o abajo, independientemente de cómo el disco esté grabado.

- En tercer lugar, es importante remarcar que los límites de 800 y 1000 Hz, así como la capacidad para localizar sonidos en la vertical, son relativos a la especie humana. Cada especie animal (y en general cualquier transductor,sea biológico o mecánico) muestra unas capacidades diferentes.

Así, por ejemplo, los gatos disponen de pabellones auditivos orientables, con lo cual pueden captar diferencias de intensidad por debajo del límite humano.

Los murciélagos en cambio se han hecho especialistas en detectar diferencias de fase en frecuencias altas, que incluso emiten ellos mismos para efectos de localización espacial. Mismamente aquí en España existen varias especies de murciélagos capaces, no sólo de detectar diferencias de fase a 60.000, 70.000 y 80.000 Hz (80 veces nuestra capacidad de localización espacial, y cuatro veces el umbral auditivo humano), sino de usarlas activamente para la caza de presas en movimiento. Claro, son murciélagos.

Por último, los búhos disponen de unos oídos cuya inserción en el cráneo es exageradamente asimétrica, lo que les permite detectar con mucha fidelidad las diferencias de sonido sobre el eje vertical y por tanto conocer con exactitud la profundidad de procedencia de un sonido, no solo su dirección. De esta forma pueden cazar ratones bajo la nieve guiándose únicamente por el sonido. Aparte del hecho de que, para ser aves, convengamos en que son bastante cabezones.

Por todo ello (conviene remarcar) los datos proporcionados sólo son válidos para nuestra especie.



Reproductores: Cowon D2 8 GB // Cowon O2 32 Gb + SDHC 16 GB.
Auriculares: Head-Direct RE0 // Ultimate Ears Triple.Fi 10.

Benedetti

#1
Tridimensionalidad en recintos acústicos: efecto Haas

Todo lo dicho explica cómo funciona la detección de la procedencia para el sonido directo, que es el sonido que tienen las diferentes fuentes sonoras en campo abierto. Sin embargo, cuando se ejecuta música en un recinto cerrado o en anfiteatros naturales, las ondas sonoras aprovechan las paredes para rebotar, rodeándose de un séquito de reflexiones (algo así como un eco sincrónico) que modifican el sonido añadiéndole cualidades tímbricas y de sonoridad. A esto lo llamamos sonido reflejado. Por tanto:

- En espacios abiertos, sonido = sonido directo (el sonido del clarinete de Woody Allen, por ejemplo).

- En recintos interiores, sonido = sonido directo + sonido reflejado (el clarinete de Woody junto con la reverberación producida por el mismo en las paredes de la sala).



El comportamiento del sonido reflejado es muy importante en la percepción de la tridimensionalidad, pues puede proporcionarnos información que nos permita localizar la ubicacion de la fuente sonora, o al contrario, puede confundirnos.

La interacción entre sonido directo y reflejado es compleja y da lugar a varios fenómenos psicológicos conocidos conjuntamente bajo el nombre de efecto de precedencia o efecto de prioridad, aunque lo más habitual es llamarlos efecto Haas, puesto que fue el médico alemán Helmut Haas quien estudió el comportamiento del oído humano en presencia de varios sonidos simultáneos en su tesis doctoral de 1949 y durante los años siguientes. Conviene aclarar que el efecto Haas es un efecto psicoacústico y no debe confundirse con un principio físico, como sí lo son los anteriores. Se darán los siguientes casos:

- Entre 0 y 50 ms. Si varios sonidos independientes llegan al oído humano en un periodo inferior a los 50 ms (milisegundos), éstos sonidos son integrados como uno solo por el oído humano. El oído deja de percibir la dirección del sonido e interpreta los sonidos posteriores como un eco o reverberación del primero. A su vez:

-Entre 0 y 5 ms. Si el desfase entre sonido directo y reflejado es inferior a los 5 ms (milisegundos), el cerebro considera a todos los sonidos como procedentes de la dirección del primero de ellos, aunque se hayan generado en direcciones opuestas. Por tanto, con retardos inferiores a los 5 ms es imposible la correcta localización del sonido.

- Entre 5 y 50 ms. Si el retardo se produce en el intervalo entre los 5 y los 50 ms, escuchamos un único sonido, de intensidad doble y con la fuente localizada en el centro de todas las existentes. El sonido aparece "centrado".

- Entre 50 y 80 ms. Lo que pasa en la franja de los 50 a los 80 ms es ambiguo. El oído percibe un "eco" no localizado que, en general, perjudica a la inteligibilidad de la palabra pero cuya presencia se considera en cambio positiva en la música. A éste "eco" lo vamos a llamar reverberación.

- Más de 80 ms. Por último, si los sonidos llegan con un desfase superior a los 80 ms, el cerebro los interpreta como sonidos completamente distintos. Cuando éste sonido procede de las reflexiones del sonido directo se llama cola reverberante, y es percibido como un eco perfectamente diferenciado (lo que normalmente llamamos eco), que se considera desagradable e inapropiado para la ejecución de música.

Para complicar aún más las cosas, si queremos que el retardo impida a nuestro cerebro localizar el sonido, la señal retrasada debe tener más nivel (ser de intensidad superior) que la primera. Así, por ejemplo, una única reflexión llegada entre 5 ms y 30 ms puede sonar hasta 10 dB más tenue que el sonido directo antes de ser percibida como un eco.  Eliminar las altas frecuencias del sonido reflejado incrementa el tiempo durante el cual la supresión del eco sigue activa. Por tanto, el efecto de eco depende tanto del retardo como de la frecuencia y la intensidad. Por ello, para averiguar la intensidad (en dB) necesaria para igualar el retardo (en milisegundos) entre dos señales, los profesionales de la acústica usan una gráfica llamada curva de Haas.

Recapitulando, el efecto Haas y fenómenos colindantes nos muestran toda la casuística involucrada en la formación de eco y el tratamiento de la reflexión sonora. Son los principales responsables de que en unos auriculares los sonidos sean más ricos que en otros, y de que otros, en cambio, sean más espaciales, permitiéndote localizar mejor la procedencia de los sonidos. Son también los principales responsables de que unas salas de conciertos suenen mejor que otras, de que guitarras, violines y pianos se construyan con una caja acústica para amplificar y colorear el sonido que individualmente las cuerdas ya producen; del llamado sonido envolvente, de la sensación de lleno orquestal, de una gran parte del soundstage y de tres cualidades tímbricas importantísimas (calidez, brillo y cercanía).

La importancia del efecto Haas habrá de ser sopesada junto a los efectos de enmascaramiento sonoro (revisar el apartado C).



Reproductores: Cowon D2 8 GB // Cowon O2 32 Gb + SDHC 16 GB.
Auriculares: Head-Direct RE0 // Ultimate Ears Triple.Fi 10.

Benedetti

#2
Entonces, ¿cómo se crea el soundstage?

Existen cuatro niveles en los cuales puede recrearse la tridimensionalidad en el sonido:

- En la sala de grabación, debido a:

   - La acústica de la propia sala.
   - La disposición espacial de los instrumentos.

- En estudio, simulando las condiciones anteriores mediante procedimientos de ingeniería de sonido.

- En la mecánica del altavoz,  que afecta a la representación del sonido grabado, dependiendo a su vez de:

   - Los materiales usados.
   - El  tipo de driver y su número.
   - La curva de evolución de la impedancia con la frecuencia en el driver.
   - La incorporación de filtros y crossovers
   - El uso de canales.

- Entre el altavoz y el oído humano, teniendo a su vez en cuenta:

   - Las características de la sala de escucha y la colocación de los altavoces, para equipos de salón.
   - La caja acústica conformada entre el auricular y el pabellón auditivo (forma de las copas en orejeros, profundidad de inserción en IEMs), para orejeros e IEMs.

Independientemente de el nivel en el que se produzcan cambios en el sonido, siempre podremos hablar de espacialidad, tridimensionalidad, soundstage (escena sonora), etc., fenómenos todos ellos cuya diferenciación es muy sutil puesto que involucran los mismos procesos físicos. Por tanto, para la producción de la tridimensionalidad, tendremos las siguientes posibilidades:

Electrónicamente, o desde el estudio de grabación, mediante dos procedimientos:

- Creando diferencias de fase entre los canales de audio (2 canales en auriculares, 6 en un sistema 5.1, etc.). Éste procedimiento es efectivo en los medios y los graves. Si se quiere puede usarse con todo el contenido frecuencial de la música, pero en los agudos no lo vamos a notar.

- Creando diferencias de intensidad entre canales, lo cual al contrario es efectivo en altas frecuencias sobre todo. Simplemente haciendo que el sonido de una guitarra se escuche al 50% de intensidad en el auricular derecho, y al 100% en el izquierdo, podemos "desplazar" sobre el escenario sonoro la guitarra, pues nuestro oído está constantemente triangulando las posiciones de las fuentes sonoras en base a la percepción diferencial de su intensidad.

Éstos dos son los procedimientos involucrados en la llamada escucha binaural (y los famosos sonidos binaurales). Aquí tenéis un ejemplo en el cual se crea la sensación de que el barbero se está moviendo alrrededor nuestro, únicamente jugando con la intensidad de sonido en ambos canales (para escuchar con auriculares; en inglés).



También podéis encontrar ejemplos de escucha binaural en el siguiente hilo:
http://www.reproductormp3.net/musica/sonidos-biaurales/


Espacialmente (y simplificando ), considerando las siguientes variables:

- La forma de la caja acústica. Llamaremos caja acústica a la sala de grabación, la sala de escucha, el interior de la caja de los altavoces, los canales de un IEM y, en general, cualquier reciento en el que se produzca amplificación del sonido. Simplificando mucho, las paredes de la caja acústica pueden tener forma cóncava, convexa o rectilínea. Cada una genera un diferente modelo de difusión:



- El tipo y disposición de los materiales en la caja acústica. Grosso modo, todos los materiales se reducen a tres tipos de comportamiento: absorvente (absorve la onda), reflectante (produce una reflexión especular de la onda, en la misma dirección y con ángulo inverso) y difusor (refleja el sonido en todas direcciones). La calificación de absorvente o reflectante no es independiente de la frecuencia, y un mismo material puede ser absorvente para unas frecuencias y reflectante para otras. El siguiente esquema ejemplifica su comportamiento típico:



-Otras variables, que no vamos a estudiar por no complicar mucho el asunto. Por ejemplo tenemos las relativas al aire (presión atmosférica, temperatura y humedad relativa). Recapitulando: la forma, tamaño y disposición de los materiales condicionan la percepción de la espacialidad a través de su influencia en el sonido reflejado.

Bueno, ésto es todo de momento. He desestimado explicar de las condiciones que afectan al funcionamiento interno de los altavoces porque son demasiado técnicas y requerirían otro post completo. La explicación dada es, que yo sepa, la más completa que hay en la red en español (y también más que lo dicho en Head-Fi.org), así que si véis éste texto copypasteao por ahí, le dáis una tollina de mi parte al responsable. Las imágenes están sacadas del librito de Carrión Isbert,al que corresponden todos los créditos por las mismas.

Un saludo a la parroquia.


Reproductores: Cowon D2 8 GB // Cowon O2 32 Gb + SDHC 16 GB.
Auriculares: Head-Direct RE0 // Ultimate Ears Triple.Fi 10.

Kalin

Joder... todo esto lo has escrito de cabeza Benedetti?? Si es así eres el Puto Amo, con mayúsculas. Madre mía!! Te prometo q en cuanto acabe los exámenes de la uni este sábado me lo leo enterito, porque el tema me parece muy interesante :perfect:

Ya te comentaré cuando lo lea ;) Muchas gracias por ofrecernos toda esta información! Tener usuarios así es todo un lujo!! :aplaudir:

Ghetto

#4
Dios... que pedazo de articulo , gracias por enseñarme/ñarnos algo mas sobre sonido  :aplaudir:

Saludos.
Auriculares: iBasso It04, Earsonics Velvet2, Audese iSine10, B&O H6 (V2)

Reproductores: Shanling M5S, iPod Classic 512, iPodnazo 240, Xduoo X3

Amplificadores/DAC: Audiolab M-Dac, Pico Slim, C&C BH2, iBasso T3

asanti


rrasio


findulas

Que arte tiene macho. Cuando te metes a una explicación te metes  :jejeje:.

Ahora mismo tengo que irme. A la noche lo leeré con tranquilidad y detenimiento.
Reproductores: iBasso DX-50 | Sony X1050 Sony A829 Sony S638F | iPod Touch 4G 32Gb Trekstor Vibez
iemsVsonic gr01 | Phonak PFE 112 | Vsonic gr07 | BrainWavz M1
Orejeros: AKG K550JVC HA-S500-Z | Koss KSC75 loignoromod
Complementos:   FiiO S3 | FiiO E7 | FiiO E9 | LOD Boteromod

Mi blog --> http://astronomocegato.blogspot.com/

Guia de Ecualización

Te invito a Dropbox

Dors-seldon

 :aplaudir: :aplaudir: :aplaudir:

Muy muy interesante, en algunas cosas me he perdido, pero por mi ignorancia o lentitud no por tu explicación que me ha parecido muy clara. Como ya te dije, me encanta como lo has explicado todo la verdad, ¿Te vienes al parque de las ciencias a explicar cualquier cosa? Seguro que lo haces mejor que yo :) .

Aunque he echado en falta una última parte a toda esta explicación, que me pareció muy interesante en el "borrador" que hiciste... podrías comentarlo  :P (que ya sabes que no me gusta anotarme puntos ajenos  ;-) )
"Un sutil pensamiento erróneo puede dar lugar a una indagación fructífera que revela verdades de gran valor."

Mi blog ----> http://dors-seldon.blogspot.com/

Auriculares: AKG k551, KZ KS6, phonak 022, AKG 601, JVC HA-FX750
Reproductores: Cowon J3 8gb, Clip+ 2gb+8gb, Sony NWZ-S639, Sony NW-A35
Otros aparatos: Kindle paperwhite Galaxy s20+

silver72

No me digais porqué, pero me da a mi que Benedetti controla un pelín de audio no?? ..... :jejeje:.
PD; Gracias Benedetti !!, te dedicas a alguna profesión relacionada con el audio ?, si no es indiscreción claro....

telematikero

A veces dais miedo.
Lo bueno de esta web es que igual alguien pregunta por el color más bonito para el ipod y otros hacen artículos técnicos sobre ondas.
Fantástico Bendetti.

PD: Empiezo este cuatrimestre asignaturas de ondas y me guardo el enlace por si sale algo por el estilo poder comentar.
Reproductores: Meizu M8, Sansa Clip +, Samsung P3,  Microsoft Zune 80, Meizu Miniplayer SP 4Gb, Sony Minidisc MZ NH900.
Auriculares: Shure SRH 840, Grado Alessandro MS1, UE Super Fi 5, SoundMagic PL30 (scarpeta's), Sennheiser CX300
Cableado de alta precisión: Loignoro wire mod, -Dan1 wire.
Amplificador: cMoyBB v2.02 Bass Booster, Fiio E5



D2Cowones

 :dios: :dios: :dios:

La longitud de onda se considera una constante universal, y es proporcional a la frecuencia. Los sonidos por encima de 800 Hz se corresponden con longitudes de onda pequeñas (inferiores a los 30 cm), por tanto, inferiores al ancho de nuestra cabeza. Ésto hace que solo sean escuchados por uno de los dos oídos, puesto que la cabeza funciona como una pantalla relativa que, dependiendo del ángulo de incidencia, puede impedir totalmente que el sonido alcance el oído opuesto a la ubicación de la fuente. De tal forma, con frecuencias altas no puede detectarse desfase, puesto que el sonido no llega eficazmente a ambos oídos

Ayer hice una pequeña prueba con el home cinema escuchando fuentes estereo en prologicII . En diferentes posiciones y girando la cabeza tienes casi la misma sensación, es como un conjunto donde todo el sonido llega casi por igual con canciones normales. Luego puse algunos ficheros de agudos de esos para quemar altavoces y  sonando todos los altavoces, la percepción girando la cabeza es como si se 'apagaran' automáticamente los altavoces del lado que en el que la oreja 'no enfoca' hacia el altavoz, me pareció muy curioso

Por cierto Benedetti por favor dame algún teléfono de contacto para mis vecinos, te quieren felicitar personalmente. Están encantados con estas pruebas, con los pitidos de los agudos y creo que su preferido es ese del helicóptero despegando para los bajos.... :gafas:

RoCKFoRD

Interesante y curioso hilo, me aclara bastantes dudas que tenía,,,👍
_________________________________________________
DAPs : AK380 | FiiO X5 III | AK Jr.| IBasso DX80 | Shanling M1 | IBasso DX50| Xuelin IHifi 770 | FiiO X1
Auris :  Hifiman HE400i | Grado SR80e | SoundMagic HP150 | CAL! | Philips SHP9500 | Takstar HI2050 | Takstar Pro80 |
Iem´s: VSonic VSD5S | KZ ZS6 | TRN-V80 | KZ ZS10 | Mee X6 Plus |
DAC: Musical Fidelity V90-BHA
HiFi Phone: Meizu Pro5

Kolru74

Vuelvo a retomar este foro...y es que alucino!!!!!! Muchas gracias el articulo es alucinante :gimnasia: :gimnasia: :gimnasia: :gimnasia: :aplaudir: :aplaudir: :aplaudir: :aplaudir:

Schenker

He visto este articulo de casualidad, reconozco que lo he tenido que leer dos veces para ir entendiendolo  :roll:  pero genial Benedetti, menudo conocimiento.. :aplaudir: