Ir al contenido

Documat


Extracción de relaciones sintagmáticas de corpus anotados

  • Autores: Borja Navarro Colorado Árbol académico, Lorenza Moreno Monteagudo, Patricio Martínez Barco Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 37, 2006, págs. 67-74
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      En este trabajo se presenta un nuevo recurso, diseñado con el objetivo de ser usado en desambiguación semántica de las palabras en español, basado en las relaciones sintagmáticas entre las palabras. Las relaciones sintagmáticas son relaciones entre sentidos dentro de un sintagma o dentro de una oración. En nuestro caso, estas relaciones han sido extraídas de un corpus anotado manualmente, corpus Cast3LB. Este corpus ha sido anotado con información sintáctica (constituyentes y funciones) e información semántica (sentidos de WordNet). De este corpus se han extraído aproximadamente 3000 patrones. Cada patrón muestra la relación sintagmática entre el sentido del verbo y el sentido de sus argumentos dentro de una oración. Sin embargo, estos patrones son excesivamente específicos para ser usados en contextos multilingües o en documentos de dominio general. Para solucionar esto es necesario obtener patrones más generales semánticamente, para lo cual se ha utilizado la ontología SUMO.

    • English

      In this paper, we present a new resource, designed for being used in WSD, based on syntagmatic relations between senses for Spanish. These relations have been extracted from a corpus: the Cast3LB corpus which has been manually annotated with syntactic and semantic information (WordNet senses). From it, approximately 3000 patterns have been extracted. These patterns show the syntagmatic relations between verb senses and its arguments within a sentence. However, these patterns can be too specific to be used in multilingual contexts or in open domain texts. Consequently, it is necessary to obtain more abstract patterns. In order to do so, we have also developed general patterns using semantic classes based on the SUMO ontology.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno