Europa financia el desarrollo de primer simulador de voz real

Investigadores de varias instituciones españolas participan en el desarrollo de un simulador para ‘visualizar’ la voz que tendrá aplicaciones en la síntesis del habla, la medicina, la logopedia, la biomecánica y la robótica. Los científicos están utilizando tecnología de supercomputación para simular de forma unificada el órgano de generación de la voz, desde la activación neuromuscular básica hasta las ondas acústicas emitidas por los labios cuando se pronuncia una sílaba.

Imagen de una simulación de voz del proyecto EUNISON. / UPC

OMC-UPC

El habla nos diferencia de los otros mamíferos, es nuestra principal conexión con el mundo y tiene una función fundamental en la sociedad moderna; sin embargo, los procesos físicos involucrados en la producción de voz humana son muy complejos. El proyecto EUNISON, financiado por la Unión Europea, se centra en simular por primera vez de forma unificada todo el órgano de generación de voz, recurriendo a la supercomputación y estudios experimentales. Los investigadores del proyecto tratan de simular de forma unificada el órgano de generación de la voz: desde la activación neuromuscular básica hasta las ondas acústicas emitidas por los labios cuando se pronuncia, por ejemplo, una sílaba.

EUNISON permitirá ‘visualizar’ la voz y tendrá aplicaciones en campos tan diversos como la síntesis del habla, la medicina, la logopedia, la biomecánica, la robótica o, incluso, en el establecimiento de nuevas formas de expresión cultural, entre otros ámbitos, señalan los participantes, entre los que se encuentran el Centro Internacional de Métodos Numéricos en Ingeniería (CIMNE) y el grupo de investigación en Tecnologías Media (GTM) de La Salle R&D.

Para los médicos, que necesitan conocer cómo se originan los problemas con la voz y cómo deben ser diagnosticados y tratados, una visualización precisa y dinámica de la biomecánica los conduciría a un progreso significativo. Por otra parte, las simulaciones animadas de lo que realmente sucede en el interior del cuerpo humano durante el habla y el canto serían de gran ayuda para los estudiantes de idiomas y de artes vocales, por lo que se hace necesaria una simulación detallada de la voz humana, tanto para la ciencia como para numerosas y diversas aplicaciones.

Los científicos usan la supercomputación para simular desde la activación neuromuscular básica hasta las ondas acústicas emitidas por los labios

Los secretos de la voz

Tras décadas de investigación, los expertos del habla todavía están buscando cómo hacer que las voces artificiales, como las que facilitan la relación persona-máquina, suenen de la manera más natural posible.

Los principios de la física clásica son la base para lograr una simulación computacional de la producción de la voz humana. La mayoría de las estrategias de modelado actuales buscan, principalmente, generar sólo la señal acústica de la voz y adoptar numerosas aproximaciones y simplificaciones para lograr este objetivo.

Por ejemplo, las síntesis de voz que se comercializan no se basan en los principios físicos, sino que recurren a elaborar concatenaciones de segmentos de audio previamente grabados. EUNISON trata de simular de forma más directa la física por la que el cuerpo produce la señal de voz.

En este sentido, la aportación del equipo del CIMNE en este proyecto, encabezada por el profesor Ramón Codina, se centra concretamente en la simulación numérica, mediante grandes supercomputadores, del flujo de aire que resulta en la generación de sonido y de la voz en el interior del cuerpo humano, concretamente en el tracto bucal.

El proyecto, que arrancó en marzo de 2013, obtendrá resultados dentro de un año, aproximadamente, y permitirá ‘visualizar’ la voz, así como dar pistas para saber cómo funciona y la forma en que ésta falla. A largo plazo, se prevé un modelo computacional detallado de la voz humana que pueda ser controlado con las señales de entrada a diferentes niveles de representación: topológico, neuromotórico o fonético.

Aplicaciones

Como motor de simulación, tendrá aplicaciones en campos tan diversos como la medicina, la otorrinolaringología, la logopedia, la síntesis del habla, la comunicación hombre-máquina, la robótica, la biomecánica, así como la influencia en el establecimiento de nuevas formas de expresión cultural.

El método de esta investigación es conseguir un dominio computacional unificado, en el que la dinámica de sólidos, fluidos/gases y las ondas acústicas se moldean simultáneamente, se trata de un potencial gran avance. El reto computacional central es extender la metodología actual de manera que pueda hacer frente a la mecánica de sólidos, colisiones elásticas, interacciones de estructuras fluidas, la aerodinámica y la acústica al mismo tiempo.

El desafío logístico es combinar el conocimiento de diversos campos, con el fin de formular y simular el conjunto detallado de las estructuras y las señales de control que el modelo requiere para que se comporten de forma realista. El desafío experimental es realizar experimentos de laboratorio con réplicas físicas para ir refinando continuamente la comprensión de la física de los procesos de fonación y articulatorios, mientras se confrontan y validan las simulaciones numéricas.

EUNISON, financiado en el marco del proyecto Future Emerging Technologies (FET)-OPEN de la Unión Europea, está liderado por el Royal Institute of Technology (KTH) de Estocolmo y, además de la UPC, también cuenta con la participación de La Salle Campus Barcelona-URL, la Friedrich Alexander Universität Erlangen Nürnberg (FAU) de Nuremberg y el Centre National de la Recherche Scientifique (CNRS) de Grenoble.

Fuente: OMC-UPC

Derechos: Creative Commons

Claves