Un enfoque gramatical para la extracción de términos índice

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1553
Información del item - Informació de l'item - Item information
Título: Un enfoque gramatical para la extracción de términos índice
Autor/es: Vilares Ferro, Jesús | Alonso Pardo, Miguel Ángel
Palabras clave: Análisis sintáctico superficial | Recuperación de información | Shallow parsing | Information retrieval
Fecha de publicación: sep-2003
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: VILARES FERRO, Jesús; ALONSO PARDO, Miguel Ángel. “Un enfoque gramatical para la extracción de términos índice”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 243-250
Resumen: La extracción de los términos que caracterizan un documento es una tarea de vital importancia en el desarrollo de sistemas de Recuperación de Información. En este artículo proponemos la utilización de análisis sintáctico superficial, implementado mediante cascadas de traductores finitos, para la extracción de términos índice complejos en base a una gramática aproximada del español que si bien es incompleta permite obtener adecuadamente las palabras involucradas en las dependencias sintácticas más importantes. La efectividad de los términos extraídos ha sido evaluada en la colección CLEF de textos en español. | The extraction of the keywords that characterize a document in a given collection is one of the most important components of an Information Retrieval system. In this article, we propose to apply shallow parsing, implemented by means of cascades of finite-state transducers, to extract complex index terms based on an approximated grammar of Spanish. The coverage of the grammar is small but it allows us to extract the words involved in the most relevant syntactic dependencies. The effectiveness of the extracted index terms has been evaluated in the CLEF collection of Spanish texts.
Patrocinador/es: Parcialmente financiado por el Ministerio de Ciencia y Tecnología (TIC2000-0370-C02-01, HP2001-0044 y HF2002-81), becas FPU de la Secretaría de Estado de Educación y Universidades, Xunta de Galicia (PGIDT01PXI10506PN, PGIDIT02PXIB30501PR y PGIDIT02SIN01E) y Universidade da Coruña.
URI: http://hdl.handle.net/10045/1553
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_31_29.pdf234,92 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.