Ir al contenido

Documat


Resumen de Internet como fuente de información léxica: extracción de etiquetas de dominio y detección de nuevos sentidos

Julio Gonzalo Arroyo Árbol académico

  • Describimos un algoritmo que combina información léxica (extraída de WordNet 1.6) con información en Internet (directorios de Altavista) para caracterizar automáticamente los sentidos de una palabra con etiquetas de dominio y, al mismo tiempo, detectar y describir nuevos sentidos relevantes en Internet. Esta información puede utilizarse, entre otras cosas, para enriquecer bases de datos léxicas, para facilitar la extracción de corpora anotados semánticamente y derivados de Internet (como material de entrenamiento para sistemas de anotación semántica), o para agrupar sentidos (de dominio coincidente) cuando las distinciones semánticas son demasiado finas para las aplicaciones en que se usan.


Fundación Dialnet

Mi Documat