Ir al contenido

Documat


Resumen de Normalización de términos multipalabra mediante pares de dependencia sintáctica

Miguel Á. Alonso Árbol académico, Francisco Mario Barcala Rodríguez, Jesús Vilares Árbol académico

  • En este artículo se presentan dos nuevas técnicas para la indexación de textos escritos en español. A nivel de palabra, proponemos la utilización de la morfología derivativa para obtener conjuntos de palabras relacionadas semánticamente. Esta técnica se combina, a nivel de frase, con la utilización de una gramática aproximada, lo que nos permitirá normalizar a una forma base común las variantes sintácticas y morfosintácticas de un término multipalabra. Dichos métodos han sido evaluados sobre un corpus de documentos periodísticos, obteniendo unos resultados que muestran una mejora considerable con respecto a los métodos clásicos de indexación.


Fundación Dialnet

Mi Documat