Ir al contenido

Documat


Resumen de Optimización multiobjetivo y paralelismo aplicados a la generación de resúmenes extractivos automáticos de múltiples documentos

Jesús M. Sánchez-Gómez

  • español

    El resumen automático es tema de gran interés en muchos campos de conocimiento, principalmente como consecuencia del crecimiento del volumen de información en los últimos años. Su objetivo es reducir la cantidad de información disponible sobre un tema concreto para facilitar su lectura y compresión. Específicamente, el problema de resumen genérico extractivo de múltiples documentos trata de generar un resumen que cubra el contenido principal de los documentos además de reducir la redundancia entre sus oraciones. Debido a los múltiples objetivos involucrados en el problema, la mejor forma de abordarlo es mediante enfoques de optimización multiobjetivo, que son capaces de optimizar simultáneamente un conjunto de funciones objetivo. Además, es necesario considerar técnicas de paralelismo para reducir el elevado tiempo de ejecución. Esta Tesis Doctoral tiene como objetivo resolver diferentes problemas de resumen de texto extractivo multi-documento mediante la aplicación de la optimización multiobjetivo y del paralelismo. Se han investigado, desarrollado y aplicado diversas estrategias de búsqueda multiobjetivo, basadas en dominancia, indicador y descomposición, mediante varios algoritmos metaheurísticos. Además, se han desarrollado diferentes diseños de paralelización para reducir el tiempo de ejecución. También se han examinado las definiciones del problema, analizando distintos esquemas de ponderación de términos, distintas medidas de similitud, e incluso diversos criterios a optimizar. El problema de resumen genérico ha recibido gran atención, y la experiencia obtenida se ha utilizado para abordar otros, como el resumen orientado a consultas, basado en sentimientos o de actualización. Los resultados obtenidos han demostrado la validez y utilidad de los enfoques planteados

  • English

    Automatic text summarization is a subject of great interest in many fields of knowledge, mainly as a consequence of the growth of the volume of information in recent years. The goal is to reduce the amount of information about a specific topic to make its reading and understanding easier. Specifically, the generic extractive multi-document text summarization tries to generate a summary that covers the main content of the documents at the same time that reduces the redundancy between its sentences. Due to the multiple objectives involved in the problem, the best way to address it is by using multi-objective optimization approaches, which are able of simultaneously optimizing a set of objective functions. In addition, it is necessary to consider parallelization techniques to reduce the high computing time. This Doctoral Thesis aims to solve different extractive multi-document text summarization problems through the application of multi-objective optimization and parallelism. Various multi-objective search strategies, based on dominance, indicator, and decomposition, have been researched, developed, and applied through several metaheuristic algorithms. Besides, different parallelized designs have been developed to reduce the computing time. The definitions of the problem have also been examined, analyzing different term-weighting schemes, different similarity measures, and even different criteria to be optimized. The generic summarization problem has received great attention, and the experience gained with this kind of problem has been used to address other related problems, such as query-focused summarization, sentiment-oriented summarization, or update summarization. The results obtained have demonstrated the validity and usefulness of the considered approaches.


Fundación Dialnet

Mi Documat