Ir al contenido

Documat


Técnicas de Deep Learning aplicadas a la detección de comportamientos agresivos

  • Autores: Fernando José Rendón Segador
  • Directores de la Tesis: Juan Antonio Álvarez García (dir. tes.) Árbol académico, Luis Miguel Soria Morillo (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Sevilla ( España ) en 2025
  • Idioma: español
  • Número de páginas: 118
  • Enlaces
    • Tesis en acceso abierto en: Idus
  • Resumen
    • La detección y comprensión de comportamientos agresivos son áreas críticas en diversos campos, como la seguridad, la psicología, la educación y las redes sociales. En esta tesis, presentada como conjunto de artículos de investigación, se exploran las técnicas de aprendizaje profundo (Deep Learning) como herramientas para abordar este desafío. El desarrollo de sistemas capaces de detectar comportamientos agresivos presenta múltiples ventajas en diversos ámbitos, incluyendo la prevención de la violencia, la mejora de la seguridad pública, la atención médica y el análisis de redes sociales. Sin embargo, este avance enfrenta desafíos significativos. La precisión en la identificación de comportamientos agresivos es crucial, pero complicada debido a la variabilidad cultural y contextual. La escalabilidad es otro desafío importante, especialmente en entornos de alta escala como las redes sociales. Las preocupaciones sobre privacidad y ética también deben abordarse cuidadosamente para evitar la vigilancia excesiva y el sesgo algorítmico. Finalmente, la capacidad de generalización de los modelos a diferentes contextos y poblaciones es fundamental para su efectividad y aplicabilidad en la práctica. Estos desafíos deben ser considerados y abordados en el desarrollo de sistemas de detección de comportamientos agresivos efectivos y éticos. En este trabajo, se presenta un sistema de detección de comportamientos violentos en videos mediante técnicas de Deep Learning. El modelo final de red neuronal profunda propuesta es un vision transformer (ViT) junto al paradigma de aprendizaje neuronal estructurado con regularización adversaria (NSL). Este modelo ha sido entrenado y evaluado con los conjuntos datos NTU CCTV Fights, UBI Fights, XD Violence, UCF Crime, Hockey Fights, Violent Flows y Surveillance Camera Fights. El modelo y el paradigma de aprendizaje propuestos obtienen entre un 99 y un 100% de precisión en los conjuntos de datos mencionados, mejorando significativamente todos los resultados previos del estado del arte. Además, el modelo propuesto consigue una mayor eficiencia en términos de recursos computacionales y en tiempo de inferencia pudiendo aplicarse a entornos reales. Por otro lado, surge la problemática de un incremento de falsos positivos en validaciones cruzadas entre distintos conjuntos de datos. Para solventar este problema se optó finalmente por el desarrollo de un modelo de red neuronal profunda de ventana deslizante basado en transformer con umbral adaptativo. La solución propuesta logra eliminar la cantidad de falsos positivos, mejorando la precisión entre un 5% y un 10 % en AUC ROC en los distintos conjuntos de validación, consiguiendo así una mejora en la generalización de la detección de comportamientos violentos.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno