Ir al contenido

Documat


Resumen de Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura

Maite Oronoz Anchordoqui Árbol académico

  • Dada la situación del Euskera (se encuentra en proceso de estandarización, es muy rica en dialectos y esta rodeada de otras lenguas) es habitual el uso en la misma, de estructuras lingüísticas que se alejan de las normas del lenguaje definidas por la Real Academia de la Lengua Vasca o Euskaltzaindia. Llamamos errores a esas estructuras que se alejan de la norma. El objetivo de esta tesis es el desarrollo de recursos para la detección y corrección de errores sintácticos. Los sistemas que hemos desarrollado para detectar y corregir de manera automática estos errores sintácticos podrán ser utilizados en el corrector gramatical para el Euskera y en sistemas para el aprendizaje de lenguas.

    En este trabajo de tesis hemos detectados errores en fechas, locuciones posposicionales y errores relacionados con la concordancia del verbo con el objeto, con el sujeto y con el objeto indirecto de la oración. Para analizar textos correctos e incorrectos, hemos utilizado la cadena de análisis sintáctico desarrollado en el grupo IXA de investigación. La información lingüística ha sido representada usando una red de anotación en XML también desarrollada en el mismo grupo.

    Después de haber realizado un análisis bibliográfico exhaustivo de las técnicas usadas para la corrección y detección de errores, hemos decidido usar técnicas basadas en conocimiento lingüístico (técnicas simbólicas) para nuestro trabajo. Así, para la detección y corrección de errores locales hemos usado dos herramientas muy conocidas en el área del Procesamiento del Lenguaje Natural: Xerox Finite State Tool (XFST) para el tratamiento de fechas y Constraint Grammar para las locuciones posposicionales. Para el tratamiento de errores que aparecen en contextos más amplios, por ejemplo errores de concordancia, nos parece adecuado el obtener el árbol de análisis de las oraciones, y dado que no hemos encontrado ninguna herramienta adecuada para este menester, hemos desarrollado la herramienta Saroi. Saroi es una herramienta general, que puede ser usada no sólo para el tratamiento de errores, si no que puede ser utilizada también para realizar consultas lingüísticas sobre árboles de dependencias. Hemos realizado un estudio exhaustivo sobre la relación de la detección de errores con la ambigüedad que queda tras el análisis de la frase (ambigüedad morfosintáctica y sintáctica).


Fundación Dialnet

Mi Documat