Ir al contenido

Documat


Resumen de Diagnóstico automático de melanoma mediante técnicas modernas de aprendizaje automático

Eduardo Pérez Perdomo

  • 1. Introducción o motivación de la tesis:

    Las tasas de incidencia y mortalidad del cáncer de piel siguen siendo una gran preocupación en muchos países. Según las últimas estadísticas sobre el cáncer de piel por melanoma, sólo en Estados Unidos se esperan 7.650 muertes en 2022, lo que representa 800 y 470 muertes más que en 2020 y 2021, respectivamente [1-3]. En 2022, el melanoma se sitúa como la quinta causa de nuevos casos de cáncer, con un total de 99.780 personas. Esta enfermedad se diagnostica principalmente con una inspección visual de la piel y luego, si quedan dudas, se realiza un análisis dermatoscópico. Sin embargo, incluso después de realizar las pruebas anteriores, puede haber dudas en el diagnóstico final, lo cual requiere una biopsia [4,5].

    El desarrollo de herramientas de diagnóstico no invasivas eficaces para las fases tempranas de la enfermedad debería aumentar la calidad de vida y disminuir los recursos económicos necesarios. El diagnóstico precoz de las lesiones cutáneas sigue siendo una tarea difícil, incluso para los dermatólogos expertos, debido a la complejidad, la variabilidad, la dudosa sintomatología y las similitudes entre las distintas categorías de lesiones cutáneas.

    Para lograr este objetivo, trabajos anteriores han demostrado que el diagnóstico precoz a partir de imágenes de la piel puede beneficiarse enormemente del uso de métodos computacionales. Varios estudios han aplicado métodos basados en el análisis manual de las imágenes dermatoscópicas e histológicas de alta calidad y, además, técnicas de aprendizaje automático, como k-nearest neighbors, support vector machines y random forest [6,7]. Sin embargo, hay que tener en cuenta que, aunque la extracción manual de características incorpora una importante base de conocimientos al análisis, la calidad de los descriptores extraídos depende en gran medida de la experiencia de los expertos. La segmentación de la lesión es otro proceso que suele realizarse manualmente. Ambos procesos consumen mucho tiempo y son propensos a cometer errores. Además, la definición explícita de una característica intuitiva e interpretable es difícilmente alcanzable, ya que depende del espacio de intensidad de los píxeles y, por tanto, no son invariables respecto a las diferencias en las imágenes de entrada [8,9].

    Por otra parte, el uso de dispositivos móviles ha aumentado considerablemente, lo que ofrece una fuente de datos casi ilimitada. Sin embargo, las imágenes no dermatoscópicas presentan un mayor desafío debido a la variabilidad del zoom, el ángulo y la iluminación. En los últimos años, se ha prestado cada vez más atención al diseño de modelos de Deep Learning para el diagnóstico del melanoma, más concretamente a las Convolutional Neural Networks. Este tipo de modelos es capaz de extraer y aprender características de alto nivel a partir de imágenes en bruto y/u otros datos sin la intervención de expertos.

    2.Contenido de la investigación:

    Como consecuencia de lo anterior, el objetivo de esta tesis doctoral es realizar aportaciones significativas al diagnóstico automático del melanoma. Las propuestas pretenden evitar el sobreajuste y mejorar la capacidad de generalización de los modelos profundos, así como conseguir un aprendizaje más estable y una mejor convergencia.

    Hay que tener en cuenta que la investigación en aprendizaje profundo suele requerir una potencia de procesamiento abrumadora para entrenar arquitecturas complejas. Por ejemplo, cuando se desarrolló la arquitectura NASNet, los investigadores utilizaron 500 NVidia P100 - cada unidad gráfica costó entre $5.899 a $7.374, lo que representa un total de $2.949.500,00 - $3.687.000,00. Lamentablemente, la mayoría de los grupos de investigación no tienen acceso a tales recursos, incluido el nuestro. Por ello, nos hemos centrado en el desarrollo de métodos eficientes y precisos para un diagnóstico del melanoma más barato y adecuado.

    En esta tesis doctoral se ha explorado el uso de varias técnicas. En primer lugar, se llevó a cabo un amplio estudio experimental, que incluyó modelos y métodos de última generación para aumentar el rendimiento. Se aplicaron técnicas bien conocidas, como data augmentation y transfer learning. Data augmentation se realiza para equilibrar el número de instancias por categoría y actuar como regularizador para evitar el sobreajuste en las redes neuronales. Por otro lado, transfer learning utiliza los pesos de un modelo preentrenado de otra tarea, como estado inicial para el aprendizaje de una tarea distinta de la anterior. Los resultados demuestran que el diagnóstico automático del melanoma es una tarea compleja. Sin embargo, diferentes técnicas son capaces de mitigar estos problemas en cierto grado. Por último, se dan sugerencias sobre cómo entrenar modelos convolucionales para el diagnóstico del melanoma y se presentan futuras líneas de investigación.

    A continuación, se aborda el descubrimiento de arquitecturas basadas en ensembles mediante el uso de algoritmos genéticos. La propuesta es capaz de estabilizar el proceso de entrenamiento. Esto es posible gracias a la búsqueda de combinaciones subóptimas de las características abstractas de los miembros del ensemble, que se utilizan para entrenar un bloque convolucional. A continuación, se entrenan varios bloques de predicción al mismo tiempo, y el diagnóstico final se consigue combinando todas las predicciones individuales. Además, el modelo propuesto está disponible en Internet y puede ser consultado por expertos.

    La siguiente propuesta se centra en el diseño de una arquitectura avanzada capaz de fusionar los bloques convolucionales clásicos y un modelo novedoso conocido como Dynamic Routing Between Capsules. Este enfoque aborda las limitaciones de los bloques convolucionales utilizando un conjunto de neuronas en lugar de una neurona individual para representar los objetos.

    Por otro lado, se propone un método robusto para el diagnóstico del melanoma, que se inspira en las conexiones residuales y en Generative Adversarial Networks. La arquitectura es capaz de producir imágenes sintéticas fotorrealistas de la piel de 512x512, incluso con pequeños conjuntos de datos de imágenes dermatoscópicas y no dermatoscópicas como dominios del problema.

    Finalmente, se propone un marco de trabajo inspirado en el aprendizaje activo. La estrategia de consulta basada en el entrenamiento por lotes permite un proceso de entrenamiento más rápido, al aprender sobre la complejidad de los datos de forma implícita. Dicha complejidad nos permite ajustar el proceso de entrenamiento después de cada iteración, lo que lleva al modelo a conseguir un mejor rendimiento en un menor número de iteraciones en comparación con un entrenamiento aleatorio.

    3.Conclusión:

    En todos los casos se realizaron amplios estudios experimentales en los que las propuestas superaron de forma significativa a varios modelos del estado del arte. Las propuestas se enfocaron en diferentes aspectos a la hora de entrenar modelos profundos: identificar técnicas relevantes, entrenar ensamblados de modelos, cómo generar nuevos datos ficticios de alta calidad, y cómo mejorar el ciclo de aprendizaje. Se emplearon varios test estadísticos, involucrando varias métricas de evaluación y conjuntos de datos de referencia en el análisis de imágenes dermoscópicas. Se indicó cuáles métodos alcanzaron un mejor rendimiento en cada una de las tareas de segmentación y diagnóstico.

    4. Bibliografía:

    [1] American Cancer Society. Cancer Facts and Figures, 2020. Consulted on April 14, 2020.

    [2] American Cancer Society. Cancer Facts and Figures, 2021. Consulted on June 22, 2021.

    [3] American Cancer Society. Cancer Facts and Figures, 2022. Consulted on February 6, 2022.

    [4] D. Altamura, S. W. Menzies, G. Argenziano, I. Zalaudek, H. P. Soyer, F. Sera, M. Avramidis, K. DeAmbrosis, M. C. Fargnoli, and K. Peris. Dermatoscopy of basal cell carcinoma: Morphologic variability of global and local features and accuracy of diagnosis. Journal of the American Academy of Dermatology, 62(1):67–75, jan 2010.

    [5] G. Argenziano, S. Puig, I. Zalaudek, F. Sera, R. Corona, M. Alsina, F. Bar- bato, C. Carrera, G. Ferrara, A. Guilabert, D. Massi, J. A. Moreno-Romero, C. Muñoz-Santos, G. Petrillo, S. Segura, H. P. Soyer, R. Zanchini, and J. Malvehy. Dermoscopy improves accuracy of primary care physicians to triage lesions suggestive of skin cancer. Journal of Clinical Oncology, 24(12):1877– 1882, 2006.

    [6] K. Korotkov and R. Garcia. Computerized analysis of pigmented skin lesions: a review. Artificial intelligence in medicine, 56(2):69–90, 2012.

    [7] M. E. Celebi, H. A. Kingravi, B. Uddin, H. Iyatomi, Y. A. Aslandogan, W. V. Stoecker, and R. H. Moss. A methodological approach to the classification of dermoscopy images. Computerized Medical imaging and graphics, 31(6):362– 373, 2007.

    [8] L. Jin, S. Gao, Z. Li, and J. Tang. Hand-crafted features or machine learnt features? together they improve RGB-D object recognition. In Proceedings of the IEEE International Symposium on Multimedia (ISM-2014), pages 311–319, Taichung, Taiwan, 2015.

    [9] X. Liu, X. Wang, and S. Matwin. Proceedings of the Interpretable Deep Convo- lutional Neural Networks via Meta-learning. In Proceedings of the International Joint Conference on Neural Networks, volume 2018-July, Rio de Janeiro, Brazil, 2018.


Fundación Dialnet

Mi Documat