Simplifying the usage and construction of deep image classification models stars

  1. Inés Armas, Adrián
Dirigida por:
  1. Jónathan Heras Vicente Director
  2. Julio Rubio García Director

Universidad de defensa: Universidad de La Rioja

Fecha de defensa: 16 de diciembre de 2022

Tribunal:
  1. Roberto Marani Presidente/a
  2. Gadea Mata Martínez Secretaria
  3. Carlos Fernández-Lozano Vocal
Tesis doctoral con
  1. Mención internacional
Departamento:
  1. Matemáticas y Computación
Programa de Doctorado:
  1. Programa de Doctorado en Matemáticas y Computación por la Universidad de La Rioja

Tipo: Tesis

Repositorio institucional: lock_openAcceso abierto Editor

Resumen

La Inteligencia Artificial, y en concreto el Aprendizaje Profundo (en inglés Deep Learning), ha cobrado gran importancia en los últimos años debido al rápido aumento de la capacidad de procesamiento, a la disponibilidad de una gran cantidad de datos y al surgimiento de diferentes librerías de código abierto que permiten su uso de manera sencilla y libre. Es por esto que las técnicas de Deep Learning se han convertido en el estado del arte para trabajar en diferentes problemas científicos y en concreto en el análisis de imágenes. A menudo, los problemas de análisis de imágenes requieren realizar tareas repetitivas que consumen una gran cantidad de tiempo, y las técnicas de Deep Learning son capaces de resolver estas tareas repetitivas de manera más rápida y eficiente. En concreto, estas técnicas han permitido grandes avances en diferentes campos como la seguridad, la medicina o la biología. Sin embargo, el uso de las técnicas de Deep Learning no es trivial. Para su uso es necesario contar con una gran cantidad de recursos computacionales, por ejemplo hardware especifico como GPUS o TPUS. Además, es necesario contar con una gran cantidad de datos anotados, algo que en campos como la medicina o la biología puede ser difícil de conseguir. Por último, es necesario contar con un conocimiento experto de estas técnicas tanto para construir modelos de Deep Learning como para usarlos. Estas necesidades dificultan la adopción y democratización del Deep Learning en campos como la medicina o la biología, donde la cantidad de recursos de datos es limitada, y en general, en cualquier campo distinto a las ciencias de la computación debido a la necesidad de un conocimento experto. Así, hemos identificado tres desafios relacionados con el uso de las técnicas de Deep Learning, que son: la cantidad de datos necesaria para el uso de estas técnicas, la democratización de la construcción de modelos de Deep Learning y la democratización del uso de modelos de Deep Learning. El objetivo de este trabajo es analizar estos desafios y crear técnicas y herramientas que ayuden a mitigarlos en el contexto de la clasificación de imágenes. En primer lugar nos hemos centrado en reducir la cantidad de datos necesarios para usar las técnicas de Deep Learning. Para ello, hemos desarrollado un framework llamado CLoDSA que permite realizar aumento de datos para problemas de clasificación, detección y segmentación de imágenes. Además, hemos creado dos algoritmos de aprendizaje semi-supevisado que permiten entrenar modelos de Deep Learning usando datos anotados y sin anotar. El primer algoritmo está basado en la destilación de datos y modelos, mientras que el segundo utiliza técnicas del análisis topológico de datos. Con el fin de democratizar la construcción de modelos de Deep Learning, hemos desarrollado una herramienta de AutoML, llamada ATLASS, que asiste al usuario en todo el proceso de creación de un modelo de clasificación de imágenes, desde la anotación de las imágenes, hasta la creación y uso de dicho modelo de Deep Learning. Esta herramienta ha sido validada con varios datasets obteniendo mejores resultados que otras herramientas de AutoML. El problema de la democratización del uso de modelos de Deep Learning se ha abordado de dos maneras distintas. En primer lugar, para tratar de reducir la cantidad de recursos necesarios para el uso de estos modelos, se ha estudiado la combinación de métodos semi-supervisados con redes compactas y técnicas de quantificación, lo que ha permitido reducir la cantidad de recursos computacionales necesarios para entrenar y usar modelos de Deep Learning. Los modelos creados con esta aproximación tienen un rendimiento similar, o incluso superior, a los modelos de tamaño estandar y además son más rápidos y ligeros. En segundo lugar se ha abordado la democratización del uso de modelos de Deep Learning creando un framework llamado DeepClas4Bio, que proporciona un punto de acceso común para los modelos de clasificación de varias librerías de Deep Learning y facilita la interoperabilidad de las herramientas de bioimagen con modelos de Deep Learning. Además, se han creado una serie de plugins para la conexión de las principales herramientas biomédicas con dicho framework. Por último, las técnicas y herramientas nombradas previamente han sido la base para abordar dos problemas biomédicos reales, como son la medición de la propagación de bacterias en imágenes de motilidad y la detección de enfermedades de la membrana epirretiniana a partir de imágenes de fondo de ojo.