, Itziar González Dios (codir. tes.) 
La simplificación automática de textos (ATS) es muy importante en el mundo actual donde el acceso a la información es masivo, pero muchos textos, como artículos científicos o documentos legales, presentan una complejidad que los hace inaccesibles para lectores con niveles de comprensión diversos. El problema principal que se presenta al momento de simplificar textos radica en cómo hacer que estos sean más claros y comprensibles sin perder el significado original. Para tratar esta problemática en esta tesis se plantean dos objetivos, la creación de sistemas neuronales seq2seq avanzados de ATS y la evaluación de los resultados dados por estos sistemas. Se desarrollaron dos sistemas principales, el primero Edit+synt, que integra información sintáctica a un sistema de edición de palabras al cuál se le agregó una capa de red convolucional de grafos que utiliza árboles de dependencias para representar las relaciones estructurales dentro de las oraciones complejas, dotando así al modelo de una representación explícita de la sintaxis. El segundo es el sistema NC-TS, basado en el canal ruidoso, en lugar de generar directamente la mejor simplificación a partir de una oración compleja, este sistema evalúa varias posibilidades y las clasifica utilizando tres probabilidades: la probabilidad de generar la oración compleja a partir de la simplificada (canal ruidoso), la probabilidad de la oración simplificada (modelo de lenguaje), y la probabilidad de la simplificación según el modelo seq2seq original (modelo directo). De esta forma, el sistema reorganiza las posibles simplificaciones generadas por el modelo BART para seleccionar la más adecuada. Los resultados muestran que ambos sistemas superan a sistemas tradicionales en métricas como SARI y BLEU. La evaluación, realizada con listas de verificación lingüística, revela mejoras significativas en fluidez, simplicidad y preservación del significado. En conclusión, esta investigación contribuye al avance del campo de la simplificación automática de textos, especialmente en lenguas con menos atención, como el español, proponiendo enfoques novedosos de ATS que combinan edición e integración de información externa.
© 2008-2026 Fundación Dialnet · Todos los derechos reservados