Estudio y aplicaciones del léxico para construir una web más inteligente

Rocío Jiménez Briones, del Departamento de Filología Inglesa de la Universidad Autónoma de Madrid (UAM), en colaboración con Mª Beatriz Pérez Cabello de Alba, del Departamento de Filologías Extranjeras y sus Lingüísticas de la Universidad Nacional de Educación a Distancia (UNED), están trabajando en el desarrollo de la Web 3.0 aportando su conocimiento sobre el lenguaje.

Estudio y aplicaciones del léxico para construir una web más inteligente
LEXICOM es un proyecto conjunto sobre el estudio del lenguaje en el que participan investigadores de diferentes universidades nacionales y extranjeras. Actualmente se está desarrollando una base de datos léxico-conceptual que es de gran utilidad para implementar la web semántica.

En esta era del conocimiento y la información ya no es suficiente con recuperar cientos de páginas web sobre el tema que nos interesa, sino que necesitamos que el ordenador ‘entienda’ el contenido de nuestra consulta y nos proporcione una respuesta inteligente (la Web 3.0).

Nos encontramos inmersos en lo que se denomina ‘la era del conocimiento y la información’, donde, a golpe de click de ratón, podemos recuperar información de toda índole en cuestión de segundos. No obstante, si formulamos una pregunta específica en uno de estos potentes buscadores, todavía no obtenemos una respuesta concreta sino todas las páginas web en las que las palabras de nuestra consulta aparecen mencionadas y sólo en la lengua de la consulta. Tal transición es lo que se conoce como el paso de la actual Web 2.0 a la web semántica o Web 3.0. Para lograrlo es imprescindible dotar a la Red de conocimiento semántico, algo en lo que el Modelo Léxico-Construccional (de aquí en adelante MLC) lleva trabajando durante años.

El MLC (Mairal Usón & Faber 2007; Ruiz de Mendoza & Mairal Usón 2008; Periñán & Mairal Usón 2009, entre otros) es una propuesta lingüística que integra nociones clave tanto de teorías lingüísticas funcionales como cognitivas, por lo que se centra en comprender no sólo las características sintácticas de las lenguas, sino la relación existente entre éstas y todos los aspectos del significado. Parece lógico pues que el pivote sobre el que gire el MLC sea el componente semántico y su posible representación.

Todo el trabajo desarrollado en el MLC se ha encaminado al diseño de unas representaciones léxicas con gran cantidad de información semántica a partir de las cuales se puedan luego predecir con más facilidad las correspondientes estructuras sintácticas en las que las palabras, principalmente verbos, aparecen. El formato de representación elegido se conoce como ‘plantilla léxica’: un tipo de macro-entrada que incorpora una descomposición semántica muy rica y detallada, información sobre los argumentos verbales necesarios, así como los rasgos pragmáticos y/o de registro referente al tipo de discurso en que aparece una palabra (legal, religioso…), su formalidad, su uso geográfico, etc.

En este trabajo, publicado en Revista Española de Lingüística Aplicada (RESLA (2008) 21: 129-146), Rocío Jiménez de la UAM y Mª Beatriz Pérez de la UNED, han estudiado los verbos ingleses que expresan felicidad y existencia, creando para ello sus correspondientes plantillas. No obstante, en otros estudios realizados por el grupo LEXICOM se han tratado otros verbos de sentimiento y existencia, así como de movimiento, de cognición y de habla, tanto en español como en inglés, alemán o italiano, pues este formato es lo suficientemente flexible e integrador como para establecer comparaciones y generalizaciones entre distintas lenguas de forma rigurosa y elegante. Además, toda esta investigación semántico-pragmática del MLC constituye la base sobre la que en la actualidad se está desarrollando una base de conocimiento léxico-conceptual multi-idioma con la que se podrá dotar a la Red de conocimiento semántico (Periñán & Mairal 2009a, 2009b).

Esta investigación se inscribe dentro los proyectos HUM2007-65755/FILO y FFI2008-05035-C02-01, dirigidos respectivamente por D. Francisco Ruiz de Mendoza y D. Ricardo Mairal Usón. Ambos proyectos de investigación están financiados por el Ministerio de Educación y Ciencia, con ayuda de fondos FEDER, y asociados al grupo de trabajo LEXICOM (www.lexicom.es).

Fuente: Universidad Autónoma de Madrid (UCCUAM)
Derechos: Creative Commons

Solo para medios:

Si eres periodista y quieres el contacto con los investigadores, regístrate en SINC como periodista.

Artículos relacionados