Categorización de textos multilingües basada en redes neuronales

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1819
Información del item - Informació de l'item - Item information
Título: Categorización de textos multilingües basada en redes neuronales
Autor/es: García Vega, Manuel | Martín Valdivia, María Teresa | Ureña López, Luis Alfonso
Palabras clave: Categorización de texto | Modelo del espacio vectorial | Recuperación de información | Redes neuronales | LVQ | Recuperación de información multilingüe
Fecha de publicación: sep-2001
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: GARCÍA VEGA, Manuel; MARTÍN VALDIVIA, María Teresa; UREÑA LÓPEZ, Luis Alfonso. “Categorización de textos multilingües basada en redes neuronales”. Procesamiento del lenguaje natural. Nº 27 (sept. 2001), pp. 265-272
Resumen: Los métodos de acceso a la información, hoy en día, deben mejorarse para superar la sobrecarga de información existente. Las tareas de clasificación de textos como la categorización de documentos puede ayudar a los usuarios a acceder a gran cantidad de información (texto) disponible en Internet y en sus organizaciones. En este trabajo presentamos un sistema de categorización multilingüe basado en corpus paralelos, concretamente la Biblia Políglota, en español e inglés. El objetivo es categorizar textos en estas lenguas usando un entrenamiento de textos multilingües. Para ello, empleamos Redes Neuronales en CT, que se comportan mucho mejor que el ampliamente utilizado algoritmo de Rocchio. El algoritmo de Widrow-Hoff y el basado en el Gradiente Exponenciado de Kivinen-Warmuth han sido usados con éxito en PLN y en particular en CT. Proponemos el uso de un método, novedoso en PLN, de aprendizaje competitivo, concretamente el algoritmo de aprendizaje por cuantificación vectorial (LVQ). Los resultados que presentamos muestran que el LVQ mejora significativamente a los otros algoritmos de aprendizaje.
URI: http://hdl.handle.net/10045/1819
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 27 (septiembre 2001)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_27_31.pdf204,52 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.