Ir al contenido

Documat


Deep Detection and Segmentation Models for Plant Physiology and Precision Agriculture

  • Autores: Ángela Casado García
  • Directores de la Tesis: Jónathan Heras Vicente (dir. tes.) Árbol académico, María Vico Pascual Martínez-Losa (dir. tes.) Árbol académico
  • Lectura: En la Universidad de La Rioja ( España ) en 2023
  • Idioma: inglés
  • Número de páginas: 157
  • Títulos paralelos:
    • Modelos de detección y segmentación para la fisiología de plantas y agricultura de precisión
  • Tribunal Calificador de la Tesis: Julio Rubio García (presid.) Árbol académico, Lucía Ramos (secret.) Árbol académico, José Boaventura Cunha (voc.) Árbol académico
  • Enlaces
    • Tesis en acceso abierto en: Dialnet
  • Resumen
    • español

      La Visión por Computador es un campo multidisciplinar que combina conceptos de Inteligencia Artificial, procesamiento de imágenes, percepción visual y ciencia de datos para permitir que los ordenadores comprendan y analicen contenido visual de manera similar a los humanos. En los últimos años, se han logrado avances significativos en la Visión por Computador gracias al desarrollo de algoritmos y técnicas basadas en métodos de aprendizaje profundo o Deep Learning. La detección de objetos y la segmentación semántica son dos áreas de la Visión por Computador que tienen numerosas aplicaciones en diversos campos como la biología, la agricultura y la medicina. Actualmente, las técnicas más exitosas para abordar estas dos tareas también se basan en métodos de Deep Learning. Sin embargo, aunque estos métodos han logrado excelentes resultados, utilizar dichas técnicas en contextos fuera del aprendizaje automático puede ser complejo. Esto se debe al gran número de imágenes requeridas para entrenar modelos de Deep Learning (que pueden ser difíciles de obtener en contextos como la biomedicina o la agricultura de precisión), el proceso de anotación de imágenes (un problema que consume mucho tiempo y requiere de experiencia) y las dificultades técnicas para entrenar y utilizar modelos de Deep Learning por parte de usuarios no expertos. El objetivo de esta tesis es abordar estas limitaciones a través de diferentes desarrollos teóricos y evaluar las soluciones propuestas en contextos reales.

      En primer lugar, nos hemos centrado en el desarrollo de métodos que nos permiten mejorar el rendimiento de los modelos de detección de objetos. Para este propósito, hemos desarrollado un algoritmo que mejora la precisión y la robustez de los modelos de detección de objetos mediante métodos de ensemble. Este algoritmo también es la base para definir métodos de aprendizaje semisupervisado que reducen el número de imágenes anotadas necesarias para entrenar los modelos de detección. Además, para facilitar la creación y uso de modelos de detección, hemos desarrollado una herramienta que simplifica el proceso de creación y uso de modelos de detección gracias a una interfaz gráfica fácil de usar. Además, hemos generalizado nuestro trabajo para facilitar la creación y uso de modelos para cualquier tarea de Visión por Computador. Por último, las técnicas y herramientas desarrolladas anteriormente han servido como base para abordar problemas en fisiología de plantas, y en agricultura de precisión. En resumen, este trabajo es un paso hacia la democratización de los modelos de Aprendizaje Profundo para usuarios fuera de la comunidad de aprendizaje automático.

    • English

      Computer Vision is a multidisciplinary field that combines concepts from Artificial Intelligence, image processing, visual perception, and data science to enable computers to understand and analyse visual content in a similar way to humans. In the last years, significant advancements have been made in Computer Vision thanks to the development of algorithms and techniques based on Deep Learning methods. Two areas of Computer Vision that have numerous applications in various fields such as biology, agriculture, and medicine are Object detection and semantic segmentation. Currently, the most successful techniques to tackle these two tasks are also based on Deep Learning methods. However, although these methods have achieved excellent results, using such techniques in contexts outside machine learning can be complex. This is due to the large number of images that are required to train Deep Learning models (which can be difficult to obtain in context like biomedicine or precision agriculture), the process of annotating images (a time-consuming and expertise-demanding problem), and the technical difficulties for training and using Deep Learning models by domain experts. The aim of this thesis is to address these limitations through different theoretical developments, and evaluate the proposed solutions in actual contexts.

      First of all, we have focused on the development of methods that allow us to improve the performance of object detection models. For this purpose, we have developed an algorithm that improves the accuracy and robustness of object detection models by means of an ensemble method. This algorithm is also the basis to define semi-supervised learning methods that reduce the number of annotated images that are needed to train object detection models. Moreover, to facilitate the create and usage of object detection models, we have developed an open source tool that simplifies the process of creating and using object detection models, thanks to a simple to use graphical interface. Furthermore, we have generalise our work to facilitate the creation and usage of models for any computer vision task. Finally, the developed techniques and tools have served as the foundation for addressing real-world problems in plant physiology, and in precision agriculture. As a summary, this work is a step towards the democratisation of Deep Learning models for users outside the machine learning community.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno