Ir al contenido

Documat


Resumen de Enrichment of language resources by exploiting new text and the resources themselves a case study on the acquisition of a ne lexicon

Antonio Toral Ruiz Árbol académico

  • Esta tesis de doctorado trata el problema del cuello de botella de la adquisición de conocimiento y específicamente, dada la importancia de las ENs en el PLN y también los problemas de su mantenimiento manual, considera la adquisición de este tipo de elemento lingüístico, La tesis parte de las conclusiones del proyecto RECENT. En el marco de este proyecto desarrollé una herramienta de reconocimiento de entidades llamada DRAMNERI. En su diseño se prestó una particular atención a la modularidad, con el objetivo de facilitar su adaptación a diferentes idiomas y dominios. La herramienta fue aplicada con éxito a diversas tareas; fue usada para reconocer entidades temporales y de cantidad en portugués, para mejorar los resultados de un sistema de búsqueda de respuestas y para construir un sistema de extracción de información en el dominio notarial.

    Sin embargo, encontramos un problema; mientras el esfuerzo necesario para construir los diccionarios y reglas requeridos en dominios específicos, como por ejemplo el notarial, era abordable, el tratamiento de dominios de carácter más general requeriría de mucho tiempo de etiquetado manual.

    Éste es el punto de partida de esta tesis, nos planteamos tratar de investigar y desarrollar una metodología para adquirir diccionarios de entidades de manera automática. La tesis generaliza el problema de la adquisición de entidades a la adquisición en general y analiza la situación actual con el fin de identificar vías plausibles para atacar el problema. Una vez concluida esta fase de índole más teórica, se aplican los conocimientos obtenidos para desarrollar una metodología que nos permita adquirir un léxico de entidades. Finalmente, para evaluar la utilidad del recurso adquirido, lo aplicamos a la tarea de búsqueda de respuestas.


Fundación Dialnet

Mi Documat