Ir al contenido

Documat


Data-efficient deep learning: age, expression, pornography, and sexual activity detection for crime prevention

  • Autores: Abhishek Gangwar Kumar
  • Directores de la Tesis: Víctor González Castro (dir. tes.) Árbol académico, Enrique Alegre Gutiérrez (dir. tes.) Árbol académico
  • Lectura: En la Universidad de León ( España ) en 2022
  • Idioma: inglés
  • Número de páginas: 105
  • Títulos paralelos:
    • Aprendizaje profundo eficaz y con datos: detección de edad, expresiones, pornografía y actividad sexual para la prevención del crimen
  • Tribunal Calificador de la Tesis: Laura Fernández Robles (presid.) Árbol académico, Ana Lucila Sandoval Orozco (secret.) Árbol académico, Sandra Eliza Fontes de Ávila (voc.) Árbol académico
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • español

      El creciente número de casos relacionados con la posesión y distribución de material de abuso sexual de menores (ASM) supone un reto importante para las fuerzas del orden.

      Del mismo modo, la detección de contenido pornográfico es también un área activa de investigación. En esta Tesis, proponemos diferentes métodos novedosos para el reconocimiento de ASM y material pornográfico.

      Nuestra estrategia consiste en dividir el problema de la detección automática de ASM en dos más simples: (i) la detección de contenido pornográfico y (ii) la clasificación de una persona por grupos de edad: como menor de edad o adulto. Este enfoque no solo simplifica el problema, sino que también hace posible la creación de conjuntos de datos etiquetados masivos, especialmente para entrenar redes neuronales profundas. Teniendo en cuenta este objetivo, en primer lugar, hemos propuesto una arquitectura de red neuronal convolucional profunda (CNN) con un novedoso mecanismo de atención y aprendizaje métrico, denotada AttM-CNN, para estas tareas. Además, las redes de detección de pornografía y de clasificación por grupos de edad se combinaron para la detección de ASM utilizando dos estrategias diferentes: fusión a nivel de decisión, para la clasificación binaria de ASM, y fusión a nivel de puntuación, para la ordenación de las imágenes en función de cuán sospechosas resultan. También presentamos dos nuevos conjuntos de datos: (i) Pornographic-2M, que contiene dos millones de imágenes pornográficas, y (ii) Juvenile-80k, que incluye unas 80.000 imágenes etiquetadas manualmente con edad facial aparente. Nuestro enfoque proporcionó mejores resultados que otros métodos del estado de la técnica en un conjunto de datos de prueba compuesto por un millón de imágenes pornográficas de adultos, un millón de imágenes no pornográficas y 5.000 imágenes reales de ASM que nos proporcionaron las fuerzas policiales.

    • English

      The growing number of cases of possession and distribution of Child Sexual Abuse (CSA) material poses a significant challenge for Law Enforcement Agencies (LEAs). Similarly, pornographic content detection is also an active area of research. In this Thesis, we propose different novel methods for CSA and pornographic material recognition.

      Our strategy lies in dividing the problem of automatically detecting CSA into two simpler ones: (i) pornographic content detection and (ii) age-group classification of a person as a minor or an adult. This approach not only simplifies the problem but also makes it feasible to create massive labelled datasets, especially to train deep neural networks.

      With this goal in mind, first, we proposed a deep Convolutional Neural Network (CNN) architecture with a novel attention mechanism and metric learning, denoted as AttMCNN, for these tasks. Furthermore, pornography detection and the age-group classification networks were combined for CSA detection using two different strategies: decision level fusion for binary CSA classification and score level fusion for the re-arrangement of the suspicious images. We also introduced two new datasets: (i) Pornographic-2M, which contains two million pornographic images, and (ii) Juvenile-80k, including 80k manually labelled images with apparent facial age. Our approach provided better results than other state-of-the-art methods on a test dataset comprising one million adult pornographic images, one million non-pornographic images, and 5,000 real CSA images provided to us by Police Forces.

      The methods and datasets introduced in this Thesis are useful for the research community and our work extended the state-of-the-art in pornography detection, age estimation, and CSA detection. All these methods can help LEAs in the task of automatic CSA detection more accurately.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno