Un enfoque gramatical para la extracción de términos índice
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1553
Título: | Un enfoque gramatical para la extracción de términos índice |
---|---|
Autor/es: | Vilares Ferro, Jesús | Alonso Pardo, Miguel Ángel |
Palabras clave: | Análisis sintáctico superficial | Recuperación de información | Shallow parsing | Information retrieval |
Fecha de publicación: | sep-2003 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | VILARES FERRO, Jesús; ALONSO PARDO, Miguel Ángel. “Un enfoque gramatical para la extracción de términos índice”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 243-250 |
Resumen: | La extracción de los términos que caracterizan un documento es una tarea de vital importancia en el desarrollo de sistemas de Recuperación de Información. En este artículo proponemos la utilización de análisis sintáctico superficial, implementado mediante cascadas de traductores finitos, para la extracción de términos índice complejos en base a una gramática aproximada del español que si bien es incompleta permite obtener adecuadamente las palabras involucradas en las dependencias sintácticas más importantes. La efectividad de los términos extraídos ha sido evaluada en la colección CLEF de textos en español. | The extraction of the keywords that characterize a document in a given collection is one of the most important components of an Information Retrieval system. In this article, we propose to apply shallow parsing, implemented by means of cascades of finite-state transducers, to extract complex index terms based on an approximated grammar of Spanish. The coverage of the grammar is small but it allows us to extract the words involved in the most relevant syntactic dependencies. The effectiveness of the extracted index terms has been evaluated in the CLEF collection of Spanish texts. |
Patrocinador/es: | Parcialmente financiado por el Ministerio de Ciencia y Tecnología (TIC2000-0370-C02-01, HP2001-0044 y HF2002-81), becas FPU de la Secretaría de Estado de Educación y Universidades, Xunta de Galicia (PGIDT01PXI10506PN, PGIDIT02PXIB30501PR y PGIDIT02SIN01E) y Universidade da Coruña. |
URI: | http://hdl.handle.net/10045/1553 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_31_29.pdf | 234,92 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.