El nuevo sistema llamado Saroi es una herramienta general, que, además de realizar el tratamiento de errores, sirve para hacer consultas en la estructura de los árboles de análisis y para realizar búsquedas de estructuras lingüísticas en dichos árboles.
Una investigadora de la UPV/EHU ha analizado las herramientas que existen para la detección y la corrección de errores sintácticos. Para detectar los errores de contexto amplio —por ejemplo, los errores de concordancia— es necesario analizar el árbol de análisis de la frase. La investigadora no ha encontrado una herramienta apropiada para ello, por lo que ha creado la herramienta Saroi, que realiza el tratamiento de los errores sintácticos, y, además, sirve para hacer consultas en la estructura de los árboles de análisis y para realizar búsquedas de estructuras lingüísticas en dichos árboles.
Saroi es una herramienta flexible y fácil de usar, y es capaz de trabajar con características lingüísticas de distintos niveles —morfológicos, morfosintácticos, sintácticos, etc.—.
La autora de la tesis y de Saroi es Maite Oronoz Anchordoqui, y su trabajo se titula Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura (Desarrollo de recursos para detectar y corregir errores sintácticos en euskera: fechas, locuciones posposicionales y concordancia). En opinión de la investigadora, dada la situación del euskera —que está en proceso de estandarización, es rico en dialectos y está rodeado de otros idiomas fuertes—, es habitual que los usuarios se alejen de las estructuras lingüísticas establecidas por las normas de Euskaltzaindia. La autora de la tesis ha definido como errores aquellas estructuras que se desvían de las estructuras correctas y de las normas.
Errores de concordancia
En su trabajo de investigación, la autora de la tesis ha detectado errores en las fechas, en las locuciones posposicionales y, sobre todo, en la concordancia entre el verbo y los elementos que ejercen la función de sujeto, objeto directo y objeto indirecto.
Para buscar dichos errores analizando de manera automática tanto corpus correctos como corpus con errores, Maite Oronoz ha utilizado el proceso de análisis sintáctico del grupo IXA de la Facultad de Informática de la UPV/EHU, y para representar la información lingüística, la red de anotaciones mediante XML.
Tras analizar las distintas técnicas para detectar y corregir errores, Oronoz ha decidido utilizar técnicas que se basan en el conocimiento de la lengua. Así, para detectar y corregir errores en contextos locales —ámbitos de cinco o seis palabras—, ha utilizado dos herramientas conocidas en el mundo del tratamiento automático de la lengua: Xerox Finite State Tool (XFST), para trabajar los errores detectados, y la Gramática de Restricciones (GR), para tratar los usos incorrectos de las locuciones posposicionales.
-----------------------------
Sobre la autora
Maite Oronoz Anchordoqui (Hondarribia, 1972) es licenciada en Informática, investigadora del grupo IXA desde 1996 y profesora auxiliar en la Facultad de Informática de la UPV/EHU desde 2001. Su tesis ha sido dirigida por Arantza Díaz de Illarraza y Koldo Gojenola del departamento de Lenguajes y Sistemas Informáticos de la Facultad de Informática de la UPV/EHU.