Se aplicará en enseñanza del español y en traducción automática

Crean un catálogo de miles de frases hechas de países hispanohablantes

Un equipo de la Universidad de Alicante está desarrollando una base de datos que incluirá miles de frases hechas usadas en los países hispanohablantes. El proyecto se centrará en expresiones fijas españolas, incluidas las propias de España y también de América Latina, sobre todo en países como Perú, Argentina y México. Se aplicará tanto para la enseñanza del español, como para la traducción automática, señala la institución.

Aprender español requiere de conocer las expresiones típicas usadas en un determinado país hispanohablante, cambiantes según la zona geográfica. Esta necesidad es la que está resolviendo el grupo FRASYTRAM (Fraseología y Traducción Multilingüe) de la Universidad de Alicante, con el proyecto Estudio lingüístico diatópico y traductológico de las construcciones verbales fijas más usuales en español.

Según los investigadores, el objetivo del proyecto es elaborar una base de datos de expresiones fijas españolas, las llamadas expresiones diatópicas, que incluirá, además de las propias de España, las utilizadas en América Latina, sobre todo en Perú, Argentina y México.Los resultados serán de aplicación práctica tanto para la enseñanza del español como lengua, como para la traducción automática.

“Agarrar de cachiche” significa en Argentina abusar de la buena voluntad de alguien, mientras “agarrarse de las mechas” es una frase hecha en México para decir que están peleando, sobretodo en caso de las mujeres. Estas frases muestran cómo existen numerosas expresiones diatópicas, muy utilizadas en sus respectivas áreas lingüísticas de influencia, que no vienen reflejadas en los diccionarios consultados y plantean problemas de comprensión y de traducción a los usuarios del español, añaden los responsables del proyecto.

Otra de las observaciones que hacen es que, en las expresiones, existen muchas variantes con el mismo significado en estos países. Además, el uso que se da a ciertos verbos según la zona geográfica, como es el caso de “coger”, que en Hispanoamérica tiene un significado sexual, hace que sólo hayan detectado 18 expresiones con la palabra, mientras en España “coger el toro por los cuernos”, “coger a alguien con el culo al aire”, “coger o tomar las de Villadiego”, son algunas de las 700 que han recopilado hasta la fecha.

Base de datos versátil

El nuevo proyecto de FRASYTRAM parte de una primera base de datos con unas 18.000 construcciones verbales recopiladas, caracterizadas por su fijación, en su mayoría del español peninsular, que ya desarrolló el grupo a partir de los proyectos de investigación financiados por la Generalitat Valenciana y la AECI, listado que amplía ahora.

Los investigadores explican que la base de datos tendrá una gran versatilidad, ya que ha desarrollado una aplicación en continuo proceso de ampliación, que organiza los fraseologismos por campos semánticos.

“Agarrar de cachiche” significa en Argentina abusar de la buena voluntad y “agarrarse de las mechas” quiere decir pelea en México

Además, permite localizar en varios campos semánticos numerosas expresiones fraseológicas españolas, junto con sus respectivas equivalencias en varios idiomas como son alemán, árabe, catalán, francés, inglés, italiano.

Los investigadores distinguen dos corpus textuales para crear la base de datos, uno a partir de periódicos y otro tomando obras literarias de autores de lengua hispana y española del siglo XX.

La idea es buscar las expresiones que aparecen en la base de datos que ya tenían, determinar las más frecuentes y fijarlas como las que se enseñen a los estudiantes que están aprendiendo español a nivel académico. Y la forma de hallarlas es “vaciando diccionarios”, ya que la fuente fiable es el buen diccionario que recoja la expresión, indica Pedro Mogorrón Huerta, director del departamento de Traducción e Interpretación de la UA y coordinador del proyecto como investigador principal.

Según Mogorrón, desde el inicio del estudio en enero de 2012, han encontrado ya alrededor de 7.000 expresiones hispanoamericanas.

Fuente: Universidad de Alicante
Derechos: Creative Commons

Solo para medios:

Si eres periodista y quieres el contacto con los investigadores, regístrate en SINC como periodista.

Artículos relacionados