Consultas con errores ortográficos en RI multilingüe: análisis y tratamiento

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/30575
Información del item - Informació de l'item - Item information
Título: Consultas con errores ortográficos en RI multilingüe: análisis y tratamiento
Título alternativo: Misspelled queries in cross-language IR: analysis and management
Autor/es: Vilares Calvo, David | Blanco González, Adrián | Vilares Ferro, Jesús
Palabras clave: Recuperación de información multilingüe | Traducción automática | Errores ortográficos | Corrección ortográfica | N-gramas de caracteres | Cross-language information retrieval | Machine translation | Misspellings | Spelling correction | Character n-grams
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2013
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: VILARES CALVO, Jesús; BLANCO GONZÁLEZ, Adrián; VILARES FERRO, Jesús. “Consultas con errores ortográficos en RI multilingüe: análisis y tratamiento”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 25-32
Resumen: Este artículo estudia el impacto de los errores ortográficos en las consultas sobre el rendimiento de los sistemas de recuperación de información multilingüe, proponiendo dos estrategias para su tratamiento: el empleo de técnicas de corrección ortográfica automática y la utilización de n-gramas de caracteres como términos índice y unidad de traducción, para así aprovecharnos de su robustez inherente. Los resultados demuestran la sensibilidad de estos sistemas frente a dichos errores así como la efectividad de las soluciones propuestas. Hasta donde alcanza nuestro conocimiento no existen trabajos similares en el ámbito multilingüe. | This paper studies the impact of misspelled queries on the performance of Cross-Language Information Retrieval systems and proposes two strategies for dealing with them: the use of automatic spelling correction techniques and the use of character n-grams both as index terms and translation units, thus allowing to take advantage of their inherent robustness. Our results demonstrate the sensitivity of these systems to such errors and the effectiveness of the proposed solutions. To the best of our knowledge there are no similar jobs in the cross-language field.
Patrocinador/es: Trabajo parcialmente subvencionado por el Ministerio de Economía y Competitividad y FEDER (proyectos TIN2010-18552-C03-01 y TIN2010-18552-C03-02) y por la Xunta de Galicia (ayudas CN 2012/008, CN 2012/317 y CN 2012/319).
URI: http://hdl.handle.net/10045/30575
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 51 (2013)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_51_02.pdf630,83 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.