Hoy en día, Internet es el medio elegido para difundir información que luego se utiliza para resolver una amplia gama de problemas. Sin embargo, a medida que aumenta la cantidad de datos almacenados, su administración se hace más difícil y los usuarios comienzan a sufrir la llamada sobrecarga de información. Muchos son los sectores que, afectados por este fenómeno, no encuentran una solución al problema.
El uso, la disponibilidad y el desarrollo de la tecnología en las últimas décadas han facilitado la recopilación de información y han permitido la generación de grandes depósitos de datos. En los últimos años, los repositorios de documentos de texto, como la Web, por ejemplo, han recibido más atención.
Dado el crecimiento exponencial del volumen de información textual, se hizo imprescindible disponer de herramientas automáticas que, a partir de la información original, diferencien lo esencial de lo que no lo es. No toda la información tiene el mismo nivel de relevancia. No sólo en términos de contenido, sino también en términos de intereses.
Obtener resúmenes de texto automáticamente puede constituir la solución a este problema, especialmente en aquellas áreas de la ciencia, como la medicina, en las que la investigación y la difusión de la información son fundamentales para su desarrollo.
Esta tesis desarrolla dos estrategias diferentes para construir resúmenes automáticos de textos utilizando técnicas de Soft Computing. La primera utiliza una técnica de Optimización mediante Cúmulo de Partículas que, a partir de la representación vectorial de los textos, construye un resumen extractivo combinando adecuadamente varias métricas de puntuación. La segunda estrategia está relacionada con el estudio de la causalidad inspirado en el manejo de la incertidumbre por parte de la Lógica Borrosa o Difusa. Aquí, el análisis de los textos se realiza a través de la construcción de un grafo mediante el cual se obtienen las relaciones causales más importantes y las restricciones temporales que afectan a su interpretación. Ambas estrategias implican fundamentalmente la clasificación de la información y reducen el volumen del texto considerando al receptor del resumen construido en cada caso.
El énfasis de esta tesis está puesto en la combinación de enfoques. Por un lado, se identifican los criterios que utiliza el usuario para seleccionar las partes relevantes de un documento. Por el otro, se construye un grafo a partir de patrones textuales útiles para la toma de decisiones. Para llevar a cabo los casos de estudio, se obtuvieron varios documentos médicos de Internet, un área para la cual se desarrolló una aplicación móvil que previene errores comunes en la administración de medicamentos dependientes del tiempo.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados