karlheinz brandenburg

Discurso de Karlheinz Brandenburg

Doctor honoris causa UPV

Excelentísimo señor Don Francisco José Mora Mas, Rector Magnífico de la UPV.

Excelentísimo señor Doctor Alberto González Salvador, Director de la Escuela de Telecomunicaciones de la UPV.

Señores decanos, señoras y señores profesores y estudiantes de la UPV.

Señoras y señores.

Lo siento, ahora tengo que continuar en inglés.

Es un orgullo y un honor estar aquí hoy. Estar ante ustedes en el 25 aniversario de la Escuela de Ingeniería y Telecomunicaciones, que todavía es joven, y recuerdo que hace 25 años que acabé mi doctorado, y ustedes han logrado grandes cosas desde entonces, de modo que les felicito.

He titulado mi discurso: Casuística para la Continuidad de la Alta Fidelidad, porque eso es realmente lo que se busca en el mundo de la ingeniería de sonido. Alta fidelidad, la reproducción fiel del sonido o generación de sonido que se percibe como original, y, de hecho, estas ideas datan de hace mucho tiempo.

Me contaron una historia que todavía no sé si es completamente cierta; cuando se inventó el fonógrafo y nació la industria del fonógrafo, los empleados de Edison viajaron por todo el mundo e hicieron demostraciones de la nueva tecnología, y dijeron «Bien, con el fonógrafo se puede reproducir el sonido de manera fidedigna y suena como el original», e hicieron pruebas en público, montaron un escenario con un telón, y detrás del telón había un violoncelista y un fonógrafo, el violonchelista tocaba una pequeña pieza de música y en el fonógrafo reproducía esa misma pieza ya grabada. La historia que me contaron dice que el público no pudo distinguir entre el violonchelista tocando en directo y el fonógrafo. Bien, no sé si alguna vez han escuchado cómo suena un fonógrafo, pero a día de hoy la historia me resulta muy difícil de creer. Entonces, ¿qué ocurrió? Realmente no lo sabemos. Creo que la gente tenía la misma capacidad auditiva que tenemos hoy en día. Probablemente no estaban acostumbrados a las diferencias que emite un fonógrafo, por lo que en cierto sentido la historia tuvo continuidad.

En la década de los 70, la alta fidelidad fue un gran pasatiempo; todo el mundo quería tener un sistema de sonido de alta fidelidad en casa. Pero, aun así, hubo diferencias, y, aún hoy, cuando voy a un auditorio o escucho la mejor tecnología de sonido, todavía puedo afirmar «Vale, hemos llegado lejos, pero tenemos mucho camino por recorrer». Entonces llegó la reproducción en estéreo, los sistemas de sonido surround 5.1, ¿alguien recuerda la cuadrofonía? Fue el primer concepto de un sistema multicanal. De modo que todos estos sistemas vienen y van. La industria discográfica creció, se redujo debido a la llegada de la radio, luego volvió a ser grande de nuevo con los discos LP, luego llegó el CD y creció aún más. Ahora las cosas están cambiando nuevamente, todavía hay dinero en la industria de la música, pero en otras áreas, por lo que hay un cambio continuo, y creo que eso es bueno.

Entonces, como han escuchado, hace 35 años, mi director de tesis, el profesor Seitzer, tuvo la idea de que podríamos emitir música a través de la línea telefónica y un agente de la oficina de patentes le dijo «Mire, no se puede obtener una patente sobre cosas que son imposibles», por lo que al profesor Seitzer le dijeron: «No, esto es imposible, no hay patente que valga». Y de este modo entré yo en juego, porque Seitzer me preguntó: «¿Puedes averiguar qué es posible? ¿Qué necesitamos? Tal vez podamos obtener una calidad razonable a través de RDSI, la Red Digital de Servicios Integrados». Pues bien, se necesitaron muchas personas y muchas ideas para hacer realidad ese sueño, de hecho, algunas de las primeras aplicaciones comerciales de nuestras nuevas tecnologías así lo hicieron; grandes cajas que costaban miles de dólares para enviar audio a través de RDSI a las emisoras de radio. Fue a principios de los 90. Pero, ¿cómo hacerlo? Tal y como pensamos anteriormente, necesitábamos conocimientos de varias disciplinas, se había estado investigando hace mucho tiempo cómo funcionaban nuestros oídos, pero no había una aplicación real. Entonces, cuando conocí a uno de los genios de la psicoacústica me dijo «Ah, genial, le has dado una aplicación a nuestra investigación básica», así que esto es solo para recordarles que a veces la investigación básica encuentra aplicaciones impensables varias décadas más tarde.

De modo que necesitábamos saber cómo funcionan nuestros oídos y cómo funciona nuestro cerebro, y necesitábamos procesar la señal, es decir, bancos de filtros, codificación Huffman y todo eso.

Y sí, hoy no pretendía hablar demasiado sobre la historia, así que, sí, esto lo llevaron a cabo investigadores de todo el mundo, creamos estándares, tuvimos dificultades y ya teníamos un estándar, pero la gente decía «Bueno, no vamos a usar vuestro equipo, usaremos el nuestro», lo superamos y, al final, no solo la tecnología avanzó, sino que el sistema también tuvo mucho éxito. Hoy en día, hay servicios como la radio por satélite, la transmisión de sonido a 40 kB por segundo, para un sonido estéreo de dos canales, que es mucho menos de lo que necesitamos para obtener RDSI y la calidad es razonable, no diría que es perfecta, es lo suficientemente buena para aquellos con un sentido auditivo privilegiado bajo estas circunstancias, pero es razonablemente bueno, y ese fue siempre uno de los objetivos, así que la pregunta era, ¿cuál es el límite para obtener una calidad razonable para las aplicaciones cuando voy en el tren o el avión, o en el coche? y ¿cuáles son los límites para llegar a un nivel donde incluso las personas con un sentido auditivo privilegiado acuerden que la calidad está bien?

Así que trabajamos en ambas cuestiones hasta el día de hoy, pero hay más trabajo por hacer, aún no hemos terminado.

Así es, la codificación de sonido está en todas partes; nuestra estimación actual es que hay alrededor de seis mil millones de dispositivos en el mundo que reproducen formato MP3 o AAC, así que, sí, todavía a veces me pregunto si estoy soñando.

Y, en efecto, si reproducimos AAC a una velocidad de bits suficientemente alta, esta será lo suficientemente buena para una escucha real de alta calidad, de hecho, comparándola con los inicios, las cintas de cassette y demás, esto es mucho mejor.

Huelga decir que siempre deseamos llegar más allá; y si miramos dónde se hallan los nuevos límites, no se trata solo de cómo funcionan nuestros oídos, sino de cómo funciona nuestro cerebro, porque es realmente necesario comprender por qué a veces obtenemos ilusiones acústicas reales, y en ocasiones todavía tenemos la sensación de que, vale, es un altavoz y puedo escuchar que es un altavoz reproduciendo música.

Y eso no es lo que llamamos inmersión, la inmersión sería como sentir realmente que es otra persona. Y, de hecho, lo que aprendimos es lo siguiente; lo que la gente experta en psicología ha sabido durante mucho tiempo, de hecho, es que nuestra expectativa determina lo que escuchamos, así que ahora podemos demostrar que, simplemente, tal y como sabemos que hay ilusiones ópticas, también hay ilusiones acústicas.

Parece que nuestro cerebro recuerda lo que sucedió, lo que ha escuchado antes, que tenemos la impresión de que ahora estoy en un auditorio, ahora estoy en una habitación pequeña, de que todo lo que escuchamos realmente lo hacemos de forma relativa a esta expectativa de lo que escuchamos, y, por cierto, hay cierta correlación para este hecho, en términos de lo que sucede en la industria, en revistas de alta fidelidad y demás; bien es sabido que si te gastas 2.000 euros en un cable para conectar tus altavoces o incluso tu toma de corriente principal a tu sistema estéreo doméstico, y tienes varios amigos que te dijeron que lo hicieras, entonces los resultados de la investigación muestran que para ti sonará mejor, sonará mucho mejor, simplemente nunca haga una prueba de audición a ciegas.

Pues bien, entonces el cerebro juega un papel fundamental en lo que escuchamos, y, sí, ¿qué está pasando? ¿Cómo usamos estos sistemas? ¿Cómo usamos este conocimiento? de hecho, a diferencia de los primeros años cuando ya existían libros sobre cómo funcionaba el oído, se sabe que existen estos efectos, pero todavía no tenemos fórmulas, creo que eso es bueno para las nuevas generaciones de investigadores, así es, todavía hay lugar para muchas más tesis, porque lo que sabemos es que las cosas son más complicadas que tener solo una fórmula para un único sonido, y si quieres alcanzar la ilusión plena de estar en otro lugar, debemos tener esto en cuenta.

Un ejemplo actual para este trabajo es la síntesis de campo de onda, como ya hemos mencionado, se trata de un trabajo pionero realizado por investigadores de los Países Bajos en la Universidad Tecnológica de Delft, hace 30 años, que pensaron que, bueno, al igual que la investigación sísmica donde tienes muchos micrófonos, ¿no podríamos hacerlo al revés y usar muchos altavoces y recrear ondas en una sala? recrear físicamente. La idea parece sencilla.

En el mundo de la ingeniería eléctrica, esto se conoce como las integrales de Kirchhoff-Helmholtz, con ecuaciones gráficas todo funciona muy bien y si tuvieses una curvatura de emisión de sonido infinitamente densa, entonces todo sería perfecto, en teoría, ya que nunca se tiene.

Alineamos los altavoces, tenemos distancias entre los dispositivos emisores de sonido, etc., así que tenemos muchas limitaciones para usar fórmulas que funcionarían, si no tuviéramos estas limitaciones y teniendo en cuenta todo lo que sabemos en este momento, incluso después 30 años de investigación en este campo, es que algunas de estas limitaciones del sistema funcionan mejor que todo lo que teníamos antes. De modo que deben realizarse más investigaciones porque a veces funciona mejor de lo que se espera en la teoría, lo cual es bueno para un ingeniero y no tan bueno para un investigador, o para la ciencia, así que tenemos que desarrollar más la ciencia en este campo. Pues bien, ya funciona en muchos casos, lo cual es positivo, realmente puedes sentir que estás en un canal o en un auditorio, de hecho, las propiedades de nuestro cerebro vuelven a entrar en juego. Por ejemplo, un efecto que puede hacer este análisis si nos encontramos en una sala como esta, el sonido se escucha no solo de los altavoces de los lados, sino también desde el rebote de las paredes. Nuestro cerebro usa estos rebotes para triangular, lo hacemos de forma inconsciente, de hecho, hacemos la triangulación para que el cerebro tenga una idea de dónde están los altavoces y no nos sentimos como en una canal. Solo si estamos en salas con una acústica muy seca, como la llamamos, en la que no haya muchos rebotes, entonces funciona mejor.

Otro aspecto sobre el que debemos investigar, de hecho, en Ilmenau, tengo un estudiante de doctorado quién me preguntó «Bien, ¿cuáles son los parámetros? ¿Cuántos rebotes están bien? y ¿cuántos no?» descubrimos que estas preguntas daban para más de una tesis doctoral. Hay mucho camino por recorrer.

De modo que existen más desafíos, incluso si conocemos la respuesta, podemos cancelar algunos de estos rebotes y, de nuevo, ha sido un gran trabajo en el que otros nos han ayudado a completar estos algoritmos, cancelar estos rebotes y demás. Pues bien, a día de hoy existen muchos más desafíos en el procesamiento de la señal de audio, de hecho, en otro trabajo, lo que hemos hecho es que tenemos sistemas que escuchan música, transcriben a partituras, si me hubieran preguntado hace 10 años habría dicho que esto es ciencia ficción, que sería posible tal vez dentro de 30 años.

Ahora funciona razonablemente bien, así que podemos hacer transcripciones automáticas, tenemos un pequeño sistema que funciona, así que si alguien quiere probarlo con canciones para ver cómo funciona, el nombre de la empresa derivada, permite practicar música con tu propio instrumento y luego el ordenador escucha lo que estás tocando y te dice cuándo has ido demasiado rápido, cuándo te has salido del tono y todo eso.

Bien, actualmente mi tema favorito es qué es la ilusión auditiva y cuáles son los límites sobre cómo funciona nuestro cerebro. Una respuesta de por qué es tan complicado ya he dado en la parte formal de la charla, y en ingeniería eléctrica nos encantan los sistemas LTI, el sistema lineal e invariante, porque permiten una gran optimización, una teoría muy elegante y durante décadas, incluso durante más de 100 años, las personas han investigado mucho sobre la optimización.

El único problema reside en que nuestro cerebro no es lineal y no es invariante en el tiempo, y el hecho de que no sea invariante en el tiempo es lo más complejo, realmente significa que cuando hablamos de escuchar, existe una diferencia de si escuchamos algo por la tarde o por la mañana, y, ¿qué hiciste el día anterior? Estas variantes hacen que escuchemos de modo diferente. Entonces, ¿cómo expresar estas variantes en los sistemas? Sin duda se trata de más desafíos.

Hay modelos matemáticos más complejos por desarrollar y existen más desafíos para todos los jóvenes investigadores, y tengo que decir que trabajar con las nuevas generaciones desde la codificación de audio hasta la síntesis de campo de ondas, el reconocimiento de la música... han sido campos divertidos en lo que trabajar, por lo que me siento muy privilegiado de tener esos temas y les agradezco nuevamente, esta vez a todos aquellos con quienes tuve el placer de trabajar. Como ya saben en lo que respecta a la tecnología, ya sea un estándar, ya sea un algoritmo nuevo, hoy en día nunca es solo el trabajo de una sola persona. Así es, cuando comencé había personas que me aconsejaban «investiga esto» y seguí ese consejo y resultó ser muy, muy valioso, así que realmente fue el camino correcto a seguir.

Tenía libros para leer, tenía colegas, teníamos un equipo, conseguimos fondos para que un gran equipo pudiera trabajar en Holanda, de modo que, sí, se lo dedico a todos ellos, no solo en Erlangen sino también a todos con los que tuve el placer de trabajar. Y es que jugaron un papel fundamental, es algo magnífico, no se trata de alguien que esté sentado en su casa anotando ideas en un pedazo de papel, en realidad se trata de trabajar con otras personas y eso, realmente, es un gran placer.

Entonces, mis recomendaciones para las nuevas generaciones: intentad lo aparentemente imposible, compartid vuestras ideas, trabajad con los demás, esto ayudará a hacer del mundo un lugar mejor.

Muchas gracias. 

Contacta con nosotros

Accede a diferentes tipos de comunicación de la UPV: consultas, solicitudes, incidencias, sugerencias, quejas, felicitaciones...