Este resumen técnico se organiza según la estructura descrita a continuación. Primero explicamos el contexto en el que se enmarca la tesis y motivamos su realización. A continuación exponemos las principales contribuciones científicas que se desarrollan en el documento. Seguidamente, presentamos las conclusiones extraídas de la experimentación con los sistemas propuestos. Finalmente, comentamos las futuras líneas de investigación que se derivan de este trabajo.
1. Motivación El melanoma es la forma más peligrosa de cáncer de piel a causa de su reducida tasa de supervivencia cuando se empieza a tratar en etapas avanzadas. Sin embargo, el pronóstico mejora notablemente si es detectado de forma precoz. La dermatoscopia es una técnica de visualización muy extendida que revela detalles texturales no apreciables mediante visión directa. Dichas texturas están correladas con las estructuras celulares subyacentes que, analizadas histopatológicamente, permiten obtener el diagnóstico definitivo de las lesiones de la piel. Esta relación tan cercana con el análisis histopatológico permite revelar signos de malignidad del melanoma precozmente y de forma no invasiva. Por tanto, hay un interés creciente en desarrollar sistemas automáticos que ayuden a los médicos a detectar esta forma de cáncer de piel a partir de la imagen dermatoscópica. A pesar de los esfuerzos investigadores, este tipo de sistemas aún no han sido incorporados a la práctica clínica diaria. Una de las razones que explican esta falta de aceptación consiste en que la mayoría de los sistemas propuestos se limitan a ofrecer un diagnóstico paralelo al del médico. Esto provoca confusión entre los especialistas, ya que no pueden acceder a las razones que llevaron al sistema a dar su propuesta de diagnóstico y por tanto considerar dicha información en la decisión diagnóstica. Un sistema cuyo diagnóstico venga acompañado de información interpretable que fundamente su sugerencia de diagnóstico gozaría de una mayor acogida.
Los Sistemas de Ayuda al Diagnóstico (SAD) pueden ser útiles en varias etapas de la atención médica. Los médicos de atención primaria tienen una formación general, y por tanto no son especialistas en lesiones de la piel. Un SAD puede ayudar a estos médicos en la identificación de casos sospechosos que deberían ser derivados a un especialista. Esto permitiría reducir el tiempo medio de detección del melanoma. En el caso de estudiantes de dermatología, o incluso dermatólogos que están aprendiendo a interpretar imágenes dermatoscópicas, un sistema automático podría ayudarles en la identificación de estructuras dermatoscópicas y otros parámetros clínicos. Para ayudar a expertos, los SAD podrían incluir versiones cuantitativas de criterios clínicos como características, lo que mejoraría la repetibilidad, y además los valores de las características podrian ser usados como información complementaria. El sistema también podría añadir una interfaz para el especialista, de manera que las razones que fundamentan la sugerencia de diagnóstico pudieran ser conocidas y juzgadas por la experiencia clínica. Por desgracia, esto no es fácil en sistemas diseñados para aprender las características, como las redes convolucionales (CNNs). En estos casos, la incorporación efectiva de conocimiento médico podría utilizarse para mejorar el rendimiento del sistema, ya que no está claro que las características aprendidas por el mismo contengan toda la información aportada por los criterios médicos.
2. Objetivos Los principales objetivos de este trabajo se resumen en los siguientes puntos:
- Diseñar un SAD para el diagnóstico precoz de melanoma que además muestre una interfaz interpretable al médico, de manera que no solo proporcione una sugerencia de diagnóstico, sino también las razones que fundamentan dicha sugerencia de diagnóstico. El sistema calculará un conjunto de características basadas en criterios clínicos, utilizando para ello el conocimiento de las estructuras dermatoscópicas y algoritmos de diagnóstico.
- Diseñar un sistema basado en CNNs que mejore el rendimiento del primer sistema. Las CNNs ya muestran resultados prometedores en muchas tareas de visión artificial, y en este problema esperamos un comportamiento similar.
- Estudiar la capacidad de las redes neuronales para resolver la tarea de segmentación automática de estructuras dermatóscópicas utilizando distintos niveles de supervisión. Esta familia de algoritmos ya ha mostrado resultados prometedores en muchos problemas de Visión Artificial, y por ello esperamos un comportamiento similar en esta tarea.
- Diseñar métodos para incorporar las segmentaciones automáticas obtenidas a una red de clasificación, con el objetivo de adaptar una red convolucional al problema de detección precoz de melanoma.
- Evaluar los métodos propuestos, con el fin de analizar sus aplicaciones potenciales como Sistemas de Ayuda al Diagnóstico.
3. Contribuciones científicas Para cumplir los objetivos presentados anteriormente proponemos dos sistemas. El primero es un sistema basado en el cálculo de características que ofrece una interfaz comprensible para ser utilizada por dermatólogos en su práctica diaria. El sistema presenta las siguientes contribuciones:
- Hemos diseñado un conjunto novedoso de características, basadas tanto en estructuras dermatoscópicas como en criterios diagnósticos de algoritmos dermatoscópicos. La base médica permite a estas características ofrecer unas prestaciones competitivas en detección precoz de melanoma y al mismo tiempo buena interpretabilidad para los dermatólogos. Además, hemos dado prioridad a obtener medidas cuantitativas de criterios clínicos, lo cual proporciona información complementaria a los médicos para tomar su decisión diagnóstica.
- Una herramienta automática que ofrece una salida probabilística como sugerencia de diagnóstico, acompañada de una medida de incertidumbre asociada a dicha decisión. También incorpora la segmentación de la imagen de la lesión en las estructuras dermatoscópicas que la componen, junto con el peso de cada estructura en la decisión final y las características que tienen mayor influencia en la sugerencia diagnóstica. Creemos que esta herramienta puede ser útil tanto para expertos como para no expertos. Para los primeros, la herramienta proporciona datos adicionales para ayudarles en su práctica clínica diaria. Para los segundos, el sistema mantiene guardados los análisis individuales de casos previos, lo cual se puede utilizar como una práctica herramienta de entrenamiento. Contiene una descripción exhaustiva de cada caso clínico, incluyendo las estructuras dermatoscópicas segmentadas y las características que tienen mayor influencia en la sugerencia de diagnóstico.
El segundo sistema propuesto está basado en redes convolucionales, ya que estos algoritmos han demostrado mejores prestaciones que las aproximaciones clásicas en muchos problemas de Visión Artificial, incluyendo el diagnóstico de lesiones de la piel. Sin embargo, pensamos que una red de clasificación de imágenes no es completamente capaz de inferir la información de estructuras dermatoscópicas, al menos con el reducido tamaño de las bases de datos disponibles actualmente. Ya que creemos en el valor diagnóstico de las estructuras dermatoscópicas, hemos diseñado un procedimiento para hacerlas participar explícitamente en la decisión final, de manera que se aproveche toda la información que ofrecen. Para ello, utilizamos además una red de segmentación para obtener los mapas de las estructuras dermatoscópicas, y una red de diagnóstico para clasificar las lesiones. Dicha red de diagnóstico recibe la imagen dermatoscópica original y los mapas de estructuras obtenidos de la red de segmentación, devolviendo una sugerencia de diagnóstico. Las contribuciones que presentamos con este sistema son las siguientes:
- Diseñamos una red de segmentación que es capaz de entrenar a partir de un conjunto heterogéneo de imágenes fuerte y débilmente anotadas, con funciones de coste diferenciadas para cada tipo de anotación. Esta red se utiliza para analizar hasta qué punto las etiquetas débiles pueden reemplazar a las etiquetas fuertes. Demostramos que una combinación de los dos tipos de etiquetas está cerca de igualar las prestaciones de una red completamente entrenada con etiquetas fuertes.
- Diseñamos una red de diagnóstico para aprender de imágenes de lesiones y sus correspondientes estructuras segmentadas. Una red principal recibe las imágenes dermatoscópicas y una red auxiliar utiliza las segmentaciones para aprender escaladores que son aplicados en puntos específicos de la red principal. De esta manera se consigue que la red auxiliar aprenda a modificar las representaciones de capas intermedias de la red principal para incorporar la información de las estructuras en la sugerencia de diagnóstico.
4. Conclusiones El primer sistema propuesto está centrado en dos aspectos: primero, un diseño de características que sigue criterios médicos para obtener buenos descriptores; segundo, un diseño cuidadoso de los bloques del sistema para favorecer la interpretabilidad, concretamente una estructura basada en la fusión tardía de decisiones de subsistemas expertos. Las características tienen el objetivo de caracterizar diachas estructuras, las cuales son clave para determinar la malignidad de una lesión en la práctica clínica. Cada subsistema experto ha sido diseñado para una de las estructuras dermatoscópicas, tomando su decisión a partir de aquellas características que modelan dicha estructura. Además, el sistema modela la incertidumbre de su propia sugerencia de diagnóstico y muestra las razones que le han llevado a tomar su decisión.
La experimentación para el primer sistema propuesto se centra en la evaluación de su rendimiento en dos escenarios diferentes: el primero utiliza lesiones que contienen ejemplos arquetípicos de estructuras dermatoscópicas; el segundo conjunto reúne casos clínicos que son dudosos para expertos. En el primer caso, nuestro sistema ofrece unas prestaciones notables con respecto a un sistema genérico (no basado en estructuras) y otros trabajos relevantes. En el segundo caso, la salida de nuestro sistema ha sido combinada con la decisión de un dermatólogo experto, ofreciendo unas prestaciones conjuntas que mejoran significativamente con respecto a las del médico individualmente. Este es un signo claro de la utilidad potencial de nuestra propuesta en la práctica clínica diaria.
El segundo sistema propuesto se basa en el paradigma dominante de las redes convolucionales. Nuestra contribución principal ha sido el diseño de un método que incorpora explícitamente el conocimiento de las estructuras de la lesión para guiar el diagnóstico de la red. Para ello, hemos entrenado una red de segmentación que obtiene los mapas de las estructuras y una red de diagnóstico para claisificar las lesiones.
La red de segmentación es capaz de aprender tanto de etiquetas fuertes como débiles, utilizando una función de coste híbrida. Hemos experimentado con diferentes proporciones de estos dos tipos de etiquetas, con la intención de encontrar una proporción entre etiquetas fuertes y débiles que ofrezca prestaciones similares a las obtenidas entrenando únicamente con etiquetas fuertes. Los resultados muestran que, una vez se alcanza un número suficiente de ejemplos fuertemente anotados, el resto del esfuerzo se puede dedicar a la obtención de etiquetas débiles. Además, los resultados muestran que la cantidad de etiquetas fuertes que se necesitan para caracterizar una estructura de forma suficiente dependen de la complejidad visual de dicha estructura. Las etiquetas débiles son sencillas de obtener para un dermatólogo, mientras que las etiquetas fuertes son mucho más costosas. Esto implica que el coste de elaborar una base de datos para segmentación de estructuras dermatoscópicas se puede reducir. A partir de un correcto equilibrio entre anotaciones fuertes y débiles, las prestaciones no se verían afectadas significativamente.
La red de diagnóstico está formada por una red principal y una red auxiliar, la cual recibe las segmentaciones de las estructuras y construye representaciones de características para incorporar esta información en diversas localizaciones de la red principal. Nuestro método mejora globalmente a dos métodos basados en "ensembles" en los primeros puestos del ISIC (una importante competición internacional de diagnóstico automático de melanomas a partir de imagen dermatoscópica), demostrando que el conocimiento médico no está completamente modelado en las características aprendidas por redes de clasificación de propósito general, incluso en arquitecturas muy profundas. Lo que es más, mejora los resultados de otros métodos del estado del arte en especificidad al 95\% de sensibilidad, una medida que refleja el caso de aplicación más probable de un SAD. Es decir, el sistema muestra una mejora significativa en filtrar casos verdaderamente benignos mientras conserva una alta especificidad, de manera que solo las lesiones sospechosas necesitan ser analizadas por dermatólogos expertos.
5. Futuras líneas de investigación Los algoritmos basados en CNNs están muy extendidos entre los SAD que trabajan con imágenes dermatoscópicas. Hasta este momento, ofrecen un rendimiento que es difícil de igualar por los sistemas que trabajan con características diseñadas específicamente para la tarea. Sin embargo, la aplicación directa de una red de clasificación debidamente ajustada al problema no cumple los requisitos de un verdadero SAD. Es poco probable que los médicos confíen en la sugerencia de una "caja negra", ya que un especialista necesitaría razones para considerar una sugerencia diagnóstica discordante con su propia opinión. Si bien es cierto que entregar una sugerencia diagnóstica a la salida es suficiente para calcular el rendimiento del sistema ante casos desconocidos, esta función por sí misma no facilita la tarea clínica. Estos criterios ya se incorporan en algunos trabajos con buenos resultados.
Nuestra red de segmentación de estructuras aún tiene capacidad limitada para orientar por completo a médicos no expertos en la identificación de estructuras dermatoscópicas. En primer lugar, la red está entrenada para detectar un subconjunto de estructuras, debido a que no se disponía de suficientes anotaciones de todas las estructuras. Algunas de las estructuras no modeladas son altamente específicas de melanoma, como el velo azul-blanquecino o la regresión. Aunque contienen un número limitado de imágenes, las anotaciones de débiles de los atlas de dermatoscopia podrían utilizarse para completar el conjunto de estructuras considerado. En segundo lugar, la resolución de nuestras segmentaciones es suficiente para nuestra red de diagnóstico, pero es limitada para mostrar detalles estructurales a plena resolución. Además, esto es un problema para estructuras marcadamente locales, como los quistes de milium, cuyas segmentaciones pueden cubrir partes de una estructura adyacente que podría ser relevante.
También creemos que el segundo sistema propuesto podría ser más eficiente, ya que la red de segmentación y la de diagnóstico son entidades separadas. El modelo se podría reducir si ambas tareas fueran resueltas por la misma red, de manera que tanto la segmentación como el diagnóstico pudieran aprenderse a la vez. Esto permitiría a la red modelar internamente las interacciones entre diagnóstico y estructuras dermatoscópicas.
Otra limitación es el alcance de la influencia de nuestra red de diagnóstico auxiliar. Es cierto que añade a la red de diagnóstico la capacidad de adaptar algunos de sus parámetros a la imagen de entrada, pero creemos que las estructuras dermatoscópicas tienen más información que ofrecer. Por ejemplo, algunas capas convolucionales podrían ser adaptativas al contenido, para que sus filtros pudieran ser modificados según el contexto de estructuras dermatoscópicas. Dichos filtros podrían modelar la atipia visual de la estructura, que es un importante signo de malignidad.
Nuestra intención es continuar este trabajo estudiando la manera en que nuestra red auxiliar modifica el comportamiento de la red principal. Nuestra hipótesis es que los escaladores de la red auxiliar siguen ciertos patrones, dependiendo del contexto de la lesión. Los escaladores podrían estar modulando los pesos de características visuales específicas de la red principal, según la importancia que estas tienen en modelar las estructuras presentes en la lesión. Esta modulación también podría contener información sobre la malignidad potencial de la lesión. A través del procesado de esta información, queremos mejorar la interpretabilidad del sistema. Siguiento esta misma línea, se podrían explorar otras modificaciones más ambiciosas en la arquitectura de algoritmos basados en CNNs, con el objetivo de ofrecer ayuda real a los dermatólogos. Lo que es más, algunas técnicas recientes de ``interpretabilidad'' podrían proporcionar intuiciones interesantes sobre lo que la red está aprendiendo en sus capas ocultas. Por ejemplo, podríamos estudiar si los canales realzados por la red auxiliar (por la presencia de una estructura dermatoscópica específica) muestran valores de activación altos con respecto a la localización de esa estructura en la imagen de la lesión. De forma similar, el análisis de mapas de activación de clase podrían revelar aquellas estructuras que la red considera como sugestivas de melanoma.
A más largo plazo, la evolución temporal de lesiones sospechosas es un parámetro importante en la detección precoz del melanoma, en un momento en el que la frontera entre lesiones benignas atípicas y malignas es todavía difusa. Esta información aún no ha sido explotada a gran escala en los SAD porque las bases de datos públicas disponibles contienen únicamente una imagen para cada lesión. Sin embargo, es importante señalar que los expertos están muy interesados en la evolución temporal de las lesiones melanocíticas. Por lo tanto, el uso de esta información en sistemas automáticos podría traer un incremento en la eficacia de estos sistemas. Es cierto que la adquisición de los datos tendría que hacerse más sistemática para incluir esta información. Los pacientes tendrían que asistir a consulta médica en intervalos regulares de tiempo, para que el intervalo entre imágenes consecutivas sea suficientemente regular. Esta es probablemente la razón principal por la que aún no hay based de datos públicas que reflejen la evolución temporal de las lesiones. Existen unos pocos trabajos que analizan la influencia de la evolución temporal a través de características inspiradas en criterios clínicos, pero las bases de datos son privadas y muy reducidas. En el caso de algoritmos capaces de aprender características, podría diseñarse una CNN recurrente para aprender patrones temporales entre imágenes de la misma lesión, no solo teniendo en cuenta el aspecto visual, sino también la evolución en la expansión de las estructuras y la aparición de otras nuevas.
Finalmente, podrían aparecer nuevas técnicas de visualización que aporten información complementaria. Hasta este momento, la dermatoscopia es la técnica más extendida para la detección precoz de lesiones sospechosas de ser melanoma, lo que se debe a la correlación que existe entre las estructuras dermatoscópicas y las estructuras histológicas subyacentes, muy relevantes en histopatología. En esta disciplina se analiza el tejido biopsiado de la lesión y se determina el diagnóstico definitivo de la misma. La dermatoscopia es una técnica no invasiva que ofrece información adicional a los expertos. Esta información podría ser expandida por técnicas de visualización emergentes como la tomografía de coherencia óptica (OCT), que permite observar cortes transversales de la piel de forma no invasiva. Actualmente, la resolución no es suficiente para apreciar las células igual que en una muestra histológica. Pero en algunos años, podría llegar a convertirse en una técnica importante si consigue aproximarse a la resolución del análisis histopatológico, de manera que un sistema automático podría analizar directamente este tipo de imágenes, que están directamente relacionadas con la información que se usa para dar el diagnóstico definitivo.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados