Ir al contenido

Documat


Resumen de The influence of context during the categorization and discrimination of Spanish and Portuguese person names

Zornitsa Kozareva, Sonia Vázquez, Andrés Montoyo Guijarro Árbol académico

  • español

    Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación.

  • English

    This paper presents a method for fine-grained categorization and discrimination of person names on the basis of the semantic similarity information. We employ latent semantic analysis which establishes the semantic relations between the words of the context in which the named entities appear. We carry out several experimental studies in which we observe the influence of the context and the robustness of our approach with different number of examples. Our approach is evaluated with Spanish and Portuguese. The experimental results are encouraging, reaching 90% for the Spanish and 82% for the Portuguese person name categorization, and 80% for the Spanish and 65% for the Portuguese NE discrimination of six conflated names.


Fundación Dialnet

Mi Documat