Maritza Callejas Cortés, Irving Orlando Ayala Iturbe, María Magdalena Méndez González, Juan Pablo Cruz Bastida
El cáncer de mama es una de las principales causas de mortalidad en mujeres a nivel mundial, lo que resalta la importancia de contar con imágenes médicas de calidad para mejorar su diagnóstico. Este estudio evalúa el uso de modelos de lenguaje grande (LLM), específicamente ChatGPT-4 para caracterizar la calidad diagnóstica de imágenes de tomografía computarizada de mama (bCT). Se diseñó un maniquí numérico que simula un corte transversal de la mama, a partir del cual se generaron 100 imágenes con variaciones en calidad de imagen. Se realizó una prueba de observador comparando el desempeño de ChatGPT-4 con seis lectores con conocimientos de Física Médica, calificando aspectos como contraste, nitidez, ruido y artefactos mediante una escala de Likert. Aunque el LLM mostró un desempeño limitado frente al observador de referencia, alcanzó concordancias ligeras cuando se comparó con observadores menos experimentados. Estos resultados sugieren que, con un protocolo de entrenamiento más robusto, los LLM podrían aproximarse al observador humano en tareas de caracterización de calidad de diagnóstica.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados