Deep Detection and Segmentation Models for Plant Physiology and Precision Agriculture stars

  1. Casado García, Ángela
Dirigida por:
  1. Jónathan Heras Vicente Director
  2. María Vico Pascual Martínez-Losa Directora

Universidad de defensa: Universidad de La Rioja

Fecha de defensa: 16 de noviembre de 2023

Tribunal:
  1. Julio Rubio García Presidente
  2. Lucía Ramos Secretario/a
  3. José Boaventura Cunha Vocal
Tesis doctoral con
  1. Mención internacional
Departamento:
  1. Matemáticas y Computación
Programa de Doctorado:
  1. Programa de Doctorado en Matemáticas y Computación por la Universidad de La Rioja

Tipo: Tesis

Repositorio institucional: lock_openAcceso abierto Editor

Resumen

La Visión por Computador es un campo multidisciplinar que combina conceptos de Inteligencia Artificial, procesamiento de imágenes, percepción visual y ciencia de datos para permitir que los ordenadores comprendan y analicen contenido visual de manera similar a los humanos. En los últimos años, se han logrado avances significativos en la Visión por Computador gracias al desarrollo de algoritmos y técnicas basadas en métodos de aprendizaje profundo o Deep Learning. La detección de objetos y la segmentación semántica son dos áreas de la Visión por Computador que tienen numerosas aplicaciones en diversos campos como la biología, la agricultura y la medicina. Actualmente, las técnicas más exitosas para abordar estas dos tareas también se basan en métodos de Deep Learning. Sin embargo, aunque estos métodos han logrado excelentes resultados, utilizar dichas técnicas en contextos fuera del aprendizaje automático puede ser complejo. Esto se debe al gran número de imágenes requeridas para entrenar modelos de Deep Learning (que pueden ser difíciles de obtener en contextos como la biomedicina o la agricultura de precisión), el proceso de anotación de imágenes (un problema que consume mucho tiempo y requiere de experiencia) y las dificultades técnicas para entrenar y utilizar modelos de Deep Learning por parte de usuarios no expertos. El objetivo de esta tesis es abordar estas limitaciones a través de diferentes desarrollos teóricos y evaluar las soluciones propuestas en contextos reales. En primer lugar, nos hemos centrado en el desarrollo de métodos que nos permiten mejorar el rendimiento de los modelos de detección de objetos. Para este propósito, hemos desarrollado un algoritmo que mejora la precisión y la robustez de los modelos de detección de objetos mediante métodos de ensemble. Este algoritmo también es la base para definir métodos de aprendizaje semisupervisado que reducen el número de imágenes anotadas necesarias para entrenar los modelos de detección. Además, para facilitar la creación y uso de modelos de detección, hemos desarrollado una herramienta que simplifica el proceso de creación y uso de modelos de detección gracias a una interfaz gráfica fácil de usar. Además, hemos generalizado nuestro trabajo para facilitar la creación y uso de modelos para cualquier tarea de Visión por Computador. Por último, las técnicas y herramientas desarrolladas anteriormente han servido como base para abordar problemas en fisiología de plantas, y en agricultura de precisión. En resumen, este trabajo es un paso hacia la democratización de los modelos de Aprendizaje Profundo para usuarios fuera de la comunidad de aprendizaje automático.