La Desambiguación Semántica Automática (DSA) es una cuestión abierta dentro del área del Procesamiento del Lenguaje Natural. En la presente tesis, se estudian modalidades concretas para la incorporación de conocimiento lingüistico en el proceso de DSA, con el objetivo de mejorar la calidad de la terea.
Se propone una nueva estrategia de desambiguación de las palabras no aisladas, sino integradas en patrones léxico sintácticos. Esta integración permite la extración de información paradigmática y antagmática relacionada con una ocurrencia ambigna dada a partes del corpus. En paralelo, se deriva a partir de EnoWodnet una nueva fuente léxica, Discrimadores de Sentido y se define en relación con ésta un nuevo algorítmo de DSA, Pueba de Conmutabilidad.
La aplicación de este último algoritmo y del algoritmo de la Marcas de Especficita sobre la información precisamente extraída del corpus lleva a u n sistema de DSA con varias heurísticas.
Los resultados obtenidos en la experimentación (una precisión de aproximadamente 95%) indican que el enfoque adoptado es idóneo para mejorar el nivel de la tasa de DSA. La tesis abre una nueva línea de investigación en DSA.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados