Categorización de textos multilingües basada en redes neuronales
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1819
Título: | Categorización de textos multilingües basada en redes neuronales |
---|---|
Autor/es: | García Vega, Manuel | Martín Valdivia, María Teresa | Ureña López, Luis Alfonso |
Palabras clave: | Categorización de texto | Modelo del espacio vectorial | Recuperación de información | Redes neuronales | LVQ | Recuperación de información multilingüe |
Fecha de publicación: | sep-2001 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | GARCÍA VEGA, Manuel; MARTÍN VALDIVIA, María Teresa; UREÑA LÓPEZ, Luis Alfonso. “Categorización de textos multilingües basada en redes neuronales”. Procesamiento del lenguaje natural. Nº 27 (sept. 2001), pp. 265-272 |
Resumen: | Los métodos de acceso a la información, hoy en día, deben mejorarse para superar la sobrecarga de información existente. Las tareas de clasificación de textos como la categorización de documentos puede ayudar a los usuarios a acceder a gran cantidad de información (texto) disponible en Internet y en sus organizaciones. En este trabajo presentamos un sistema de categorización multilingüe basado en corpus paralelos, concretamente la Biblia Políglota, en español e inglés. El objetivo es categorizar textos en estas lenguas usando un entrenamiento de textos multilingües. Para ello, empleamos Redes Neuronales en CT, que se comportan mucho mejor que el ampliamente utilizado algoritmo de Rocchio. El algoritmo de Widrow-Hoff y el basado en el Gradiente Exponenciado de Kivinen-Warmuth han sido usados con éxito en PLN y en particular en CT. Proponemos el uso de un método, novedoso en PLN, de aprendizaje competitivo, concretamente el algoritmo de aprendizaje por cuantificación vectorial (LVQ). Los resultados que presentamos muestran que el LVQ mejora significativamente a los otros algoritmos de aprendizaje. |
URI: | http://hdl.handle.net/10045/1819 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 27 (septiembre 2001) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_27_31.pdf | 204,52 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.