The influence of context during the categorization and discrimination of Spanish and Portuguese person names

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/2950
Información del item - Informació de l'item - Item information
Título: The influence of context during the categorization and discrimination of Spanish and Portuguese person names
Autor/es: Kozareva, Zornitsa Petrova | Vázquez, Sonia | Montoyo, Andres
Palabras clave: Discriminación de nombres | Categorización de nombres | Información semántica | Name discrimination | Name categorization | Semantic information
Fecha de publicación: sep-2007
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: KOZAREVA, Zornitsa Petrova; VÁZQUEZ PÉREZ, Sonia; MONTOYO GUIJARRO, Andrés. "The influence of context during the categorization and discrimination of Spanish and Portuguese person names". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 81-88
Resumen: Este artículo presenta un nuevo método para la categorización y la discriminación de nombres propios utilizando como fuente de información la similitud semántica. Para establecer las relaciones semánticas entre las palabras que forman el contexto donde aparece la entidad que queremos categorizar o discriminar, nuestro método utiliza la semántica latente. Se han realizado diferentes experimentos donde se ha estudiado la influencia del contexto y la robustez de nuestra aproximación sobre distintos números de ejemplos. La evaluación se ha realizado sobre textos en español y portugués. Los resultados obteniendos son 90% para español y 82% para portugués en categorización y un 80% para español y un 65% para portugués en discriminación. | This paper presents a method for fine-grained categorization and discrimination of person names on the basis of the semantic similarity information. We employ latent semantic analysis which establishes the semantic relations between the words of the context in which the named entities appear. We carry out several experimental studies in which we observe the influence of the context and the robustness of our approach with different number of examples. Our approach is evaluated with Spanish and Portuguese. The experimental results are encouraging, reaching 90% for the Spanish and 82% for the Portuguese person name categorization, and 80% for the Spanish and 65% for the Portuguese NE discrimination of six conflated names.
Patrocinador/es: This research has been funded by QALLME number FP6 IST-033860 and TEXT-MESS number TIN2006-15265-C06-01.
URI: http://hdl.handle.net/10045/2950
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_39_10.pdf221,69 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.