Los humanos decimos de forma natural el punto hasta el que dos cosas cualquiera están relacionadas o no, Denominamos medida de la naturaleza de la relación a esa capacidad, es decir, la capacidad que mide la fuerza que tiene la relación entre dos palabras. Para poder formalizar y llevar a cabo la medida de la naturaleza de la relación se necesitan recursos lexicales estructurados. Las principales aportaciones de esta tesis son las siguientes:
1. Formalización de la naturaleza de la relación entre palabras y conceptos basados en el conocimiento.
2. Definición del método para enriquecer y fortalecer los recursos lexicales estructurados extraídos de diccionarios.
La primera aportación se ha concretado en la Densidad Conceptual, que hemos realizado sobre la base de conocimiento lexical WordNet, en inglés. Hemos explicado las ventajas teóricas de nuestra formalización y la hemos evaluado con dos tareas prácticas. Por un lado, en la desambiguación de las palabras, hemos desambiguado todos los nombres de un corpus público en inglés. Hemos comparado la Densidad Conceptual con otros dos métodos, logrando mejores resultados. Por el otro, también la hemos aplicado a la corrección automática de textos ingleses, pero en ese caso con la ayuda de otras fuentes de conocimientos, por ejemplo la gramática reductora, la frecuencia de las palabras y las concurrencias. El sistema que hemos llevado a cabo ha demostrado que es posible escoger sugerencias de correcciones con una gran precisión.
En cuanto a la segunda aportación, es sabido que el conocimiento extraído de los diccionarios suele ser limitado. Las jerarquías se construyen entre las palabras, no entre los significados. Además, a las jerarquías extraídas se les ha achacado ser pequeñas y de estructura mediocre en la superficie. Con este trabajo queremos probar que hay un modo de superar esas barreras, accediendo a la base de conocimiento de una lengua p
© 2008-2024 Fundación Dialnet · Todos los derechos reservados