Volver
Sonido 3D TAV-EDF
Contactar
  Online translator:
Tutorial Sonido 3D
Versión 2.0 - Barcelona


Localización de las fuentes de sonido en el mundo real y virtual
(Link) La primera versión para PC data de 1990


INTRODUCCIÓN

Hace algún un tiempo, invitamos a un invidente a tener una experiencia auditiva con un sistema de Realidad Virtual. Incluso, nosotros mismos nos tapamos los ojos para realizar el experimento. Pues bien, hay que decir que´el resultado, fue muy decepcionante. De hecho, pudimos percatarnos que el sonido en estos sistemas es casi un mero acompañamiento de una imagen 3D interactiva. El sonido, en sí mismo, desde el punto de vista espacial no es lo suficientemente bueno como para que, un invidente ( O nosotros mismos) pudiéramos recrear en nuestra mente el espacio envolvente. Todo se reduce a una estereofonía más o menos realista aunque desprovista de los indicios psicoacústicos que nos hacen sentir el espacio sonoro circundante como auténticamente real.
De hecho, este resultado es lo que se esperaba puesto que, en el mundo real, tal como veremos después, la percepción del espacio se conforma a través de una conjunción psíquica entre vista y oído en total sincronía. Nuestro compañero invidente tampoco pudo recrear en su mente el espacio circundante, tal como sucede en la vida real.
Hay que decir que, personalmente volví a repetir el experimento, esta vez con la imagen. Pues bien, puede comprobar que la ayuda visual que ofrecía el sistema, fue más que suficiente para obtener un buen resultado a pesar de las deficiencias del audio desde el punto de vista espacial.


LA PERCEPCIÓN DE LA DIRECCIÓN

Las diversas teorías de la localización del sonido se basan en la diferencia de marcha o camino recorrido por las ondas sonoras hasta llegar a cada uno de los oídos. Si la fuente de sonido se encuentra delante del oyente, exactamente en el plano de simetría de la cabeza, el camino recorrido por el frente de onda hasta encontrarse con los oídos es el mismo. Se recibe, entonces, en cada uno de ellos, la misma información y en el mismo instante. Por lo tanto, miramos hacia adelante para poder evaluar con más precisión la posición de la fuente sonora, acto guiado por el cerebro, una vez realizado el análisis de la información recibida en las áreas auditivas corticales.
Si la fuente sonora no se encuentra exactamente delante (o detrás) del oyente, aparece una diferencia de marcha o camino recorrido proporcional al seno del ángulo formado respecto del plano de simetría de la cabeza.
Observemos con atención el dibujo de la izquierda, el cual, describe la disposición de las partes implicadas en un experimento de audición donde, el oyente, recibe señales acústicas desde una fuente sonora. El oído derecho recibe una parte de la señal acústica radiada por la fuente sonora F. Con el izquierdo ocurre exactamente lo mismo, con la salvedad, tal como comentábamos hace un momento, de que las trayectorias desde la fuente a cada uno de los oídos no tienen la misma longitud. Por lo tanto, en todas las posiciones, excepto cuando la fuente sonora se encuentra delante del oyente, (o justamente detrás) aparece una diferencia de tiempo en la llegada del frente de ondas a los oídos del oyente.
A esta diferencia de tiempo habrá que añadir una diferencia de amplitud dependiente de la frecuencia.
La señal que llega hasta el oyente es, en casi todos los casos, una onda compleja, es decir, el resultado de la superposición de muchas ondas simples provenientes del foco sonoro. Por lo tanto, en nuestro dibujo, la amplitud que llega a los oídos del oyente es una función de la frecuencia. Las bajas frecuencias se difractarán muy bien alrededor de la cabeza del oyente y la amplitud de la señal en cada oído será practicamente la misma. No ocurrirá lo mismo con las componentes de frecuencia alta, las cuales, producirán una notable diferencia de presiones entre sus oídos.

En resumen, la dirección de donde proviene un sonido se basa en la detección, por parte del cerebro, de las correspondientes diferencias de tiempo, y presión sonora que se producen en los oídos, suponiendo la no intervención de la memoria. Si aceptamos la intervención de la memoria podríamos hablar de diferencias de tiempo y timbre.
En cuanto a las diferencias de fase (Φ=K.Δr) puede demostrarse que esta magnitud no juega ningún papel en la localización de la dirección de una fuente sonora. Baste decir que diferentes direcciones de una fuente sonora podrían producir la misma relación de fase, según las frecuencias emitidas.
También es muy interesante observar que otra fuente sonora simétricamente situada respecto de F producirá las mismas diferencias de tiempo, amplitud y timbre. A pesar de eso, podemos localizar, sin ambigüedad, las correspondientes direcciones de cada una de las fuentes situadas a la izquierda o la derecha. Todo ello, nos informa que el cerebro detecta cual de los oídos recibe el primer frente de onda procedente de la fuente.
Incluímos este efecto en lo que conocemos como "Ley del primer frente de onda o Efecto Haas" porque, en las dos situaciones posibles: sonido directo o sonido directo más reverberación, el comportamiento del cerebro es básicamente el mismo, esto es: detectar cual de los oídos recibe la primera señal. Todo lo dicho hasta el momento nos sirve para evaluar la dirección de donde proviene un sonido en base a:

  • Diferencias de tiempo. (Efecto fisiológico).
  • Diferencias de presión sonora. (Efecto fisiológico).
  • Diferencias de timbre. (Efecto psico-fisiológico).
  • Ley del primer frente de onda. (Efecto haas).
Por último, diremos que también aparece en la sala de conciertos un campo reverberante, el cual, "personalizará" el frente de ondas directo que llega al oyente (Efecto Hass, propiamente dicho). Los músicos saben que no todas las salas de concierto suenan igual. Es el campo reverberante más las resonancias propias las que "colorean" la radiación directa de la fuente.
Ahora, falta averiguar si es posible localizar una fuente sonora en el sentido de la profundidad en la dirección detectada. Tema que vamos a tratar seguidamente.


LA PERCEPCIÓN DE LA PROFUNDIDAD

Acabamos de repasar los conceptos fundamentales en los cuales se basa la detección por parte del oído y cerebro de la dirección en donde se encuentra una fuente sonora. Esto es, la diferencia de trayectoria desde la fuente a cada oído, generará las correspondientes diferencias de tiempo, presión sonora y timbre. añadiendo la ley del primer frente de onda, la cual, nos evita experimentar la ambigüedad izquierda-derecha. No obstante, en determinadas situaciones estos parámetros no son suficientes para entender la localización por el oído. En este apartado intentaremos aclarar esta cuestión.

Es conocido que el ser humano interactua con el medio a través de sus cinco sentidos. En los entornos virtuales esta interacción viene dada por los sentidos de la vista, oído y, algunas veces, muy pocas, por el tacto. Son, sin embargo, la vista y el oído los más importantes tanto en el mundo real como en el virtual. Puede decirse que estos órganos sensoriales se complementan de forma perfecta para conseguir localizar, a distancia, un cuerpo emisor de ondas en el espacio tridimensional. La vista o el oído, considerados de forma aislada, también nos ayudan en esta interacción con el medio pero, repetimos,

"es la conjunción de la vista y el oído lo que permite al ser humano desenvolverse e interactuar con el mundo, siempre y cuando nuestro cerebro, después del lento aprendizaje ocurrido en nuestra más tierna infancia, pueda dirigir el funcionamiento de estos órganos de forma conjunta y ordenada." Veámoslo:

Supongamos que nos encontramos en una gran explanada. En un momento determinado se produce un ruido que nos llama la atención. De forma casi automática, lo que hacemos es girar la cabeza hasta localizar la dirección de la fuente de sonido.
Una vez localizada, lo único que queda por hacer es detectar el origen en esa dirección. Para realizar esta acción de manera prácticamente instantánea tenemos la visión binocular que nos informará del lugar donde se encuentra la fuente sonora, siempre y cuando ésta sea visible. Si, en este proceso de evaluación del origen del sonido, hubiéramos utilizado únicamente nuestros oídos, el margen de error en la detección de la posición de la fuente, en el sentido de la profundidad, habría sido mucho mayor, más aún para nosotros, tan acostumbrados a utilizar los sentidos de la vista y oído de forma conjunta.
Es cierto que existen determinados modos de evaluar la distancia a que se encuentra una fuente sonora pero, mientras podamos utilizar la visión, lo seguiremos haciendo en detrimento de la apreciación de distancias por el sonido. Otra cosa sería padecer una ceguera total, pues, sólo en este caso, las propiedades de localización por el oído alcanzarían su máximo rendimiento.

Observemos, ahora, la figura de la izquierda: observamos a un oyente O y tres fuentes sonoras, F1, F1' y F2, las cuales, al esta lo suficientemente alejadas supondremos la llegada de ondas planas.
La diferencia de tiempo t1, presión sonora y timbre detectado por el cerebro del oyente permitirá determinar en que dirección se encuentra la fuente sonora F1. Ahora bien, observemos que la fuente F1' situada en la misma dirección producirá igual diferencia de tiempo y de presión.
La fuente F2 producirá la diferencia de tiempo t2. En nuestro caso se cumple que t1 = t2 puesto que, en este ensayo hemos escogido una posición posterior en las que las distancias existentes desde la fuente F2 a los oídos del oyente es idéntica a las distancias entre la fuente F1 y dicho oyente.
Si, ahora, elevamos las fuentes sonoras manteniendo sus distancias relativas respecto de la cabeza del oyente, las diferencias de amplitud y tiempo seguirán siendo las mismas.
Ante esta situación de ambigüedad en la apreciación de direcciones y distancias, (diferentes posiciones en el espacio producen idénticas diferencias de tiempo y de presión) el cerebro no tiene otro remedio que recurrir a otros métodos de evaluación de la posición de la fuente sonora.
Existe en el proceso de audición una variación de magnitudes que nos ayudarán a determinar la posición, en el sentido de la profundidad de una fuente sonora o, al menos, evaluar el lugar aproximado donde se encuentra.

  • La evaluación de la sonoridad en función de la distancia existente entre fuente y oyente. Hemos de decir que la apreciación de distancias en base a la sonoridad es francamente muy pobre. Factores tales como la reverberación o los cambios de volumen de la fuente en el origen enmascararán las apreciaciones. No obstante, la variación de la sonoridad es un truco muy utilizado en las técnicas de grabación multipista para dar la sensación al oyente de que determinados instrumentos se encuentran más alejados y, por esta razón, su sonoridad es menor. Representa un indicio aproximado para localizar a la fuente sonora.

  • En grandes recintos, salas de concierto, teatros, etc. La relación sonido directo/reflejado también puede ayudarnos a evaluar si la fuente sonora se encuentra cerca o lejos del oyente. No sirve para determinar una posición concreta. Este efecto es muy utilizado, también, en los estudios de grabación.

  • El efecto Knudsen, es decir, el cambio de timbre por absorción de las frecuencias altas por el aire nos informará de la lejanía o cercanía de la fuente, pero no de su localización precisa. Además, es necesario conocer previamente el sonido, esto equivale a decir que la intervención de la memoria es esencial. Un buen técnico de grabación utilizará este efecto junto con los dos anteriores para dar sensación de lejanía a determinados instrumentos.

  • La relación presión/velocidad de las partículas. Si nos encontramos en el campo cercano de la fuente, es decir, en aquel lugar en el cual la radiación de la fuente sonora se describe como una onda esférica, es posible, según Von Békesy, determinar la distancia de la fuente mediante dicha relación en función de la distancia y la frecuencia, lo cual se traduce en un cambio de timbre variable según la distancia fuente-oyente. Su efecto está limitado a distancias muy cercanas a la fuente.

  • El conocimiento que tengamos sobre un sonido también nos ayudará a situar correctamente a la fuente sonora en el espacio. Por ejemplo, si oímos el ruido producido por un avión, las diferencias de tiempos y presión sonora, nos informarán de la dirección donde se encuentra el origen del sonido pero si identificamos el tipo de ruido, habrá una tendencia clara a levantar la cabeza y mirar al cielo en la citada dirección. Claro que también puede suceder que el avión puede estar en tierra momentos antes del despegue. Es, entonces, cuando el sentido de la vista entra en acción para eliminar toda duda sobre la posición del avión.

  • Los movimientos de la cabeza en animales y humanos son cruciales para determinar la dirección, sin las ambigüedades "delante-detras" o "arriba y abajo" de una fuente sonora. Para confirmar este aserto, podemos realizar el siguiente experimento. En una habitación con algún tipo de fuente sonora, colocamos una cabeza artificial provista de los correspondientes micrófonos. También, instalamos un sistema de seguimiento, el cual permitirá a está moverse como cualquier cabeza humana (izquierda-derecha y arriba-abajo)
    Acto seguido, introducimos en otra sala de audición a un oyente provisto de auriculares y el sistema impulsor de los movimientos de la cabeza artificial.
    Entonces, ocurre lo siguiente: mientras el sistema de seguimiento se encuentre desconectado, al oyente le será muy difícil averiguar si la fuente sonora se encuentra delante o detrás. Incluso arriba o abajo.
    Todo lo contrario ocurre cuando conectamos el dispositivo de seguimiento. En estas condiciones, el oyente, gracias a los movimientos de cabeza, seguidos con precisión por la cabeza artificial, podrá detectar la posición de la fuente sonora, llegando, incluso a averiguar si se encuentra en la parte anterior o posterior.
    Con este tipo de experimentos, en los que De Boer fue pionero, llegamos, pues, a la conclusión de que los movimientos de la cabeza, unido a la asimetría de ésta más la forma de los pabellones auditivos, son cruciales para averiguar la posición de una fuenta sonora en el espacio.

  • La visión es el punto final en la determinación de la posición de una fuente sonora. Ésta nos dará, después de las sucesivas evaluaciones de la posición realizadas por el sistema auditivo, la posición exacta de la fuente de sonidos. Si la visión no existe, la tolerancia en la apreciación de la posición será mucho mayor.
    Al ser la percepción del entorno una conjunción de propiedades psico-fisiológicas, extendiendo su dominio, en la gran mayoría de personas, a los sentidos de la vista y el oído, es realmente difícil la percepción auténticamente tridimensional del sonido en los sistemas de reproducción acústica. No obstante, con los sistemas de Realidad Virtual, al trabajar conjuntamente con sonido e imagen mas interactividad, es posible recrear espectaculares espacios visuales y sonoros de gran efectividad. Lamentablemente, en la gran mayoría de sistemas RV el sonido, en cuanto a prestaciones espaciales, no se encuentra a la altura de la imagen.


SÍNTESIS

En resumidas cuentas, tal como acabamos de leer, los mecanismos que tiene nuestro cerebro para localizar y situar espacialmente a una fuente sonora en el ESPACIO REAL utilizando dos oídos sanos son:

Determinación de la dirección:

  • Diferencias de tiempo. (Efecto fisiológico)
  • Diferencias de presión sonora. (Efecto fisiológico)
  • Diferencias de timbre. (Efecto psico-fisiológico)
  • Ley del primer frente de onda. (Efecto Haas).

Determinación de la distancia o posición en el espacio:

  • Movimientos de la cabeza.
  • Relación sonido directo/reflejado.
  • Efecto Knudsen.
  • Evaluación de la sonoridad.
  • Teoría de Von Békesy.
  • Conocimiento sobre el sonido percibido.


ALTERNATIVAS DE ESCUCHA


LA AUDICIÓN CON ALTAVOCES

Supongamos, ahora, que al oyente "O1", situado en la sala de conciertos, le colocamos un minúsculo micrófono en cada oído o, mejor aún, lo sustituimos por una cabeza artificial. A continuación, según la parte inferior del dibujo, enviamos las señales I y D recogidas a los amplificadores a1 y a2, los cuales, a su vez, enviarán las señales a sus respectivas pantallas acústicas situadas en una sala de audición.
La experiencia nos dice que el oyente O2 situado en la sala de audición no obtiene la misma impresión de dirección y espacio sonoro que el oyente O1 situado en la sala de conciertos. Basta observar que el oído izquierdo de O2 no solamente recibe la señal del oído izquierdo de O1 sino, también, una componente de diafonía d procedente de la pantalla acústica derecha.
Lo mismo podemos decir del oído derecho, el cual, además de la señal que le es propia, recibe la componente de diafonía i procedente de la pantalla situada a su izquierda. Este grave defecto del sistema estereofónico convencional, hace imposible recrear un espacio sonoro idéntico al que se produce en la sala de conciertos.
También, existe un campo sonoro reverberante r originado en la sala de audición que modificará el campo directo y reverberante original de la sala de conciertos.
Reducir el campo reverberante en la sala de audición no es difícil. En cambio, la eliminación de las señales de diafonía i y d es realmente un problema complejo que requiere la manipulación algebraica del sonido procedente de la sala de conciertos.
Mientras que algunos investigadores han creado teorías y implementaciones más o menos complejas para eliminar esta diafonía. Otros, en cambio, dudan si realmente este procedimiento es el correcto. Basta observar que la cancelación trans-aural será eficaz siempre y cuando la reverberación de la sala tienda cero y el oyente se situe enfrente de los altavaces, simétricamente situado, tal como podemos ver en la figura adjunta.



LA AUDICIÓN CON AURICULARES

Es obvio que la audición con auriculares eliminaría la diafonía entre los dos canales, puesto que la señales de los oídos izquierdo y derecho del oyente O1 en la sala de conciertos, llegarían a los respectivos oídos del oyente O2 en la sala de audición. En este sentido, la diafonía habría sido eliminada por completo.
No obstante, aparece un serio inconveniente que también impedirá la recepción de un campo sonoro espacial completo.
Supongamos que realizamos nuevamente el experimento anterior pero, en este caso, sustituimos las pantallas acústicas por unos auriculares. El oyente de la sala de conciertos recoge a través de sus diminutos micrófonos un campo sonoro idéntico al que recoge su sistema auditivo. Se comprende que si O1 se mueve o gira la cabeza, las diferencias de tiempo, presión sonora y timbre recogidas corresponderán a la nueva posición. Es decir, a cada posición del oyente (o de la fuente sonora) se creará un patrón determinado en cuanto a la información recogida (diferencias de tiempos, presión sonora y timbre) y, gracias a esta información, el cerebro situará a la fuente sonora en la adecuada dirección.
Evidentemente, no ocurre lo mismo con el oyente de la sala de audición, el cual, recordemos, en este momento está utilizando auriculares. Si, en cualquier momento, gira la cabeza hacia un lado, el campo sonoro percibido también se moverá hacia ese lado puesto que él es el portador de los elementos de transducción electroacústicos (auriculares). En estas condiciones, la información recibida seguirá siendo la misma, independientemente de los cambios de posición. Nos encontramos, pues, ante una experiencia inusual para el cerebro, puesto que en el mundo real, tal como le sucede al oyente en la sala de conciertos, a cada posición tendría que recibir un patrón determinado de información.
Ante esta situación, el sonido deja de percibirse como un campo espacial en lo que respecta, sobretodo, a la descriminación de las señales delante-detrás.

En definitiva, las alternativas que tenemos a nuestra disposición en la reproducción del sonido son:

  1. Reproducción monofónica
    Sin efectos indicadores de dirección.

  2. Reproducción estereofónica convencional.
    Aquí aceptamos la diafonía acústica como un mal menor dada la simplicidad que reporta este sistema. Con modernas técnicas de grabación pueden lograrse muy buenos resultados.

  3. Reproducción estereofónica con auriculares.
    Se obtienen reproducciones sonoras con una total independencia de los dos canales.
    A pesar del inconveniente señalado anteriormente, hace unos años se popularizaron grabaciones de gran calidad realizadas con cabeza artificial inmóvil.
    Es posible, también, crear entornos virtuales sonoros en los cuales, la posición de las fuentes sonoras sean independientes de los movimientos del oyente gracias a los dispositivos de seguimiento.

  4. Reproducción cuadrafónica.
    Aquí se añaden, al sistema estéreo convencional, dos o más canales laterales o posteriores para dar cuenta de los efectos reverberantes de la sala de conciertos o incluir efectos especiales envolventes. También es posible recrear imaginativos espacios sonoros.

  5. Sistemas electroacústicos en los que se elimina la diafonía de la sala de audición
    Con este sistema pueden conseguirse reproducciones sonoras de gran impacto y efectividad desde el punto de vista espacial, eliminado cualquier tipo de canal complementario dando lugar a compactos equipos de reproducción sean utilizando dos pantallas acústicas, al igual que la estereofonía convencional o, incluso, con una única pantalla acústica. (Vease en esta misma web el sistema (Link) Sonido 3D TAV-EDF) Estos sistemas son muy útiles, incluso para entornos virtuales. En este sentido, el usuario se coloca un ligero y cómodo casco sensorial con el sistema de visualización y seguimiento. El sonido, en este caso concreto, proviene de altavoces convenientemente situados.


REALIDAD VIRTUAL

Una vez descritas las bases en que se apoyan la estereofonía y cuadrafonía, estamos preparados para describir los dispositivos electroacústicos asociados con los equipos de Realidad Virtual. El primer paso, tal como hemos hecho en alguna otra ocasion, será definir, lo más claramente posible, el término Realidad Virtual.

Desde mediados de la decada de los 40, los investigadores empiezan a experimentar e interactuar con los primeros ordenadores de muy diversas maneras. En los primeros tiempos, dicha interacción venía dada, en el sentido hombre-máquina por la combinación lógica de diversas conexiones realizadas en una especie de panel de control o utilizando teclados primitivos.
Las respuestas de la máquina se interpretaban a través de combinaciones luminosas, dispositivos electromecánicos, etc. Eran, sin ningún lugar a dudas, toscos sistemas de comunicación.
La aparición de la pantalla de rayos catódicos significó un paso de gigante en la comunicación entre la máquina y el hombre. Con el tiempo, los interfaces fueron perfeccionándose hasta llegar a los modernos teclados, pantallas y demás accesorios de comunicación de la actualidad. Si a este significativo desarrollo del hardware añadimos el ocurrido de forma paralela en el software obtenemos, finalmente, los modernos ordenadores multimedia de la actualidad con sistemas operativos gráficos relativamente fáciles de utilizar.
Hoy en día, la información que procesamos con los ordenadores puede estar compuesta de textos, imagen, vídeo, sonido y música. Sin embargo, en líneas generales, la transferencia de información es aún un proceso artificial que se aparta bastante de los clásicos esquemas de la comunicación que, por propia naturaleza, el ser humano ha desarrollado en su lenta pero inexorable evolución. Esto es, la comunicación directa, frente a frente, utilizando canales de transmisión-recepción naturales de gran anchura de banda, donde los datos enviados o recibidos fluyen con extrema facilidad.
Estos canales de comunicación son, en este caso, simplemente el aire que transporta las variaciones de presión sonora y la luz, portadora de las imágenes que podemos ver. Si añadimos el tacto como un medio más de transferencia de información, la cantidad total de datos que pueden transmitirse por segundo entre dos seres humanos interactuando directamente es realmente fantástica si la comparamos con los miles de bits por segundo que puede manejar un modem de última generación.
La idea, entonces, es esta: ¿Por qué no comunicarse con los sistemas informáticos utilizando los esquemas clásicos de la comunicación? La propuesta es realmente fascinante, pues el ordenador y el ser humano se reencontrarían en un nuevo entorno diseñado especificamente para interactuar con gran eficacia. Además, también facilitaría el trabajo de los usuarios que podrían actuar de forma mucho más natural e intuitiva, tal como acostumbra a hacerse en el mundo real.
Es cierto que esta nueva manera de enfocar " la relación hombre máquina" va a generar una gran cantidad de problemas técnicos, en especial los relacionados con la anchura de banda del canal de comunicación, velocidad e interactividad. No obstante, en el futuro, estos escollos desaparecerán, tal como ha pasado en otras ramas de la tecnología. Será, entonces, cuando dispondremos de un auténtico universo alternativo para trabajar o pasar nuestros momentos de ocio, ofreciéndonos espacios alternativos para la música, la cultura, la ciencia, el teatro y el cine.
Como esta sección está dedicada al sonido, enfocaremos la tecnología virtual desde este punto de vista, sin olvidar la estrecha relación existente con el sentido de la vista. De hecho, cuando se habla de Realidad Virtual, nos imaginamos a un usuario interactuando con la visión en un mundo tridimensional. En cuanto al sonido, es cierto que es muy importante, pero generalmente no se le presta la debida atención.

Tal como comentamos en otra ocasión, nosotros podemos asegurar que el sonido, como principal portador de la emoción y sentimiento de una imagen, es el toque final para conseguir un mundo virtual de elevado realismo. Ahora bien, para que la escena observada sea creible espacialmente es deseable que exista una estrecha correlación entre la imagen y el sonido y, además, la interactividad ha de permitir que, a pesar de los movimientos del usuario, el espacio virtual permanezca estable
Por ejemplo, imagínate que te has introducido en un entorno virtual. En un momento determinado cierras los ojos. ¿Qué pasa entonces? Si realizas la misma acción en el mundo real, los estímulos acústicos te ayudarán a mantener la imagen mental de la escena que tan sólo hace un momento estabas observando. ¿Ocurre lo mismo en un entorno virtual? La verdad es que en la mayoría de máquinas bautizadas con este nombre el sonido es un mero acompañante y la asociación con la imagen observada es, en muchas ocasiones, muy simple. Si, por ejemplo, aparece una moto por el lado izquierdo, es cierto que el tubo de escape sonará por el auricular izquierdo, pero la similitud con el mundo real acaba aquí. La espacialidad sonora, esto es, la sensación de profundidad no existe, pues la imagen de la moto puede aparecer a una distancia virtual de cinco metros pero el sonido del tubo de escape lo tienes dentro de la cabeza. Es decir, la correlación audio-visual no es, ni mucho menos, perfecta. No obstante, aunque dicha correlación no sea la óptima, el cerebro del oyente intentará situar a la fuente sonora en el lugar correcto de la imagen... y la mayoría de veces lo consigue.
Finalmente, la estabilidad espacial, esto es, la capacidad del sonido y la imagen de permanecer estáticos a pesar de los movimientos del observador es una cualidad fundamental que han de poseer los entornos virtuales de calidad.
En resumen, veamos rapidamente, los requisitos indispensables de un sistema acústico para Realidad virtual.

Correlación entre sonido e imagen
Si el observador permanece inmóvil y es el objeto de la escena virtual el que se mueve de derecha a izquierda o viceversa, el sonido deberá parecer que se mueve con él en el mismo sentido.
Si el desplazamiento ocurre en el sentido de la profundidad o arriba y abajo, diversos mecanismos de actuación sobre los canales sonoros deben de hacernos creer que el sonido sigue a la imagen.

Estabilidad espacial
El campo sonoro, al igual que la imagen, a de permanecer estable en el espacio virtual independientemente de los movimientos del observador. Lo ideal sería conseguir los seis grados de libertad en el movimiento de éste:

  • Movimiento delante/atrás.
  • Moviento hacia la izquierda y/o derecha.
  • Movimiento hacia arriba o abajo.
  • Función rotatoria lateral.
  • Función rotatoria vertical.
  • Función rotatoria horizontal.

En la práctica, escogeremos los grados de libertad en función del tipo de entorno virtual. Por ejemplo, si el observador se encuentra sentado, cosa por otra parte bastante común, escogeremos como imprescindibles:

  • Función semi-rotatoria vertical.
  • Función semi-rotatoria horizontal.

De esta manera, el observador podrá mover la cabeza mirando hacia arriba, abajo, izquierda y derecha mientras que el entorno visual y acústico mantiene su estabilidad espacial.
Digamos, finalmente, que para conseguir la estabilidad espacial de la escena, junto con los sistemas de visualización, audición y tactiles, es necesario incorporar un dispositivo de seguimiento/orientación para que el ordenador "pueda conocer" en todo momento la posición en que se encuentra el observador y actuar en consecuencia con la imagen, el sonido y el tacto. Es decir, la interactividad entre el usuario y el ordenador ha de ser muy alta.


NOTA FINAL

A pesar de que, en lo que respecta al fenómeno de la localización por el oído, hemos puesto cierto énfasis en el fenómeno de las diferencias de tiempo, los sistemas electroacústicos utilizados en los procesos de grabación/reproducción actuales, utilizan de forma casi exclusiva el control de la posición a través de las diferencias de amplitud de las ondas detectadas por el oído. (Estereofonía de intensidad) Éste es un proceso sencillo, sin prácticamente ninguna complicación tecnológica, utilizado masivamente en los procesos de mezcla, tanto en Estereofonía como Cuadrafonía. Otro asunto muy diferente es incluir, además de las citadas diferencias de amplitud, diferencias de tiempo o timbre lo cual requiere de una tecnología mucho más elaborada y sofisticada.
Hemos de reconocer que, en la mayoría de ocasiones, no será necesario recurrir a estos procesos adicionales. De hecho, en nuestro rápido repaso de los sistemas de reproducción electroacústicos convencionales, hablaremos siempre de las diferencias de amplitud en los oídos del oyente, dejando de lado otros conceptos relacionados con la localización. Esto sucede así porque en el estudio de grabación, cuando el técnico ajusta el control panorámico de un canal, está manipulando la diferente amplitud de la señal en cada uno de los canales estéreo o cuadrafónicos.
No obstante, si lo que pretendemos es obtener un realismo muy cercano a la experiencia sensorial cotidiana, será de gran utilidad aprovechar al ciento por ciento, todas las posibilidades que el sistema de audición nos ofrece. Uno de estos casos, de gran interés práctico, son los dispositivos electroacústicos destinados a formar parte de los equipos de Realidad Virtual.



Arriba

El sonido 3D en Hi-Fi y Realidad Virtual. Copyright: Rivel. Roger Andreu. Barcelona. España