Ir al contenido

Documat


Uso de patrones secuenciales multivariantes para clasificación y extracción de conocimiento temporal: estudio de supervivencia de pacientes en la Unidad de Quemados Críticos

  • Autores: Isidoro Jesús Casanova López
  • Directores de la Tesis: Manuel Campos Martínez (dir. tes.) Árbol académico, Jose M. Juarez (dir. tes.) Árbol académico, José Ángel Lorente Balanza (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Murcia ( España ) en 2023
  • Idioma: español
  • Enlaces
    • Tesis en acceso abierto en: DIGITUM
  • Resumen
    • español

      Esta tesis centra su investigación en los datos provenientes de pacientes con grandes quemados que han ingresado en la UCI y cuya evolución ha sido registrada diariamente. Algunos parámetros clínicos disponibles desde la llegada del paciente, como la edad o la extensión del quemado, permiten realizar una primera valoración de la severidad y ayudan a pronosticar la supervivencia estimada en la admisión. Sin embargo, el estudio de la evolución de otros parámetros clínicos registrados durante los primeros 5 días de estancia en la UCI (pH, diuresis, exceso de base, …) puede ayudar a definir objetivos y a valorar la evolución y respuesta al tratamiento. En esta tesis se plantea la generación de potencial conocimiento observando la evolución en el tiempo de estas variables, de forma que se podría llegar a pronosticar la supervivencia de un paciente o sugerir nuevas ideas a los médicos acerca del comportamiento de estas variables. METODOLOGÍA. Se define inicialmente un proceso de descubrimiento de conocimiento con los siguientes 4 pasos: 1) discretización de los atributos temporales, 2) minería de patrones secuenciales multivariantes, 3) posprocesamiento, filtrando como patrones interesantes aquellos que sean discriminatorios, y aplicando posteriormente una representación comprimida de estos patrones, 4) clasificación de la supervivencia de los pacientes con modelos interpretables. Posteriormente compararemos como diferentes discretizaciones afectan a la clasificación e intentaremos reducir el número de patrones secuenciales usados como predictores en los clasificadores, realizando una evaluación de su consistencia. Además, proponemos el uso de un indicador estadístico ampliamente utilizado en estudios epidemiológicos, la Razón de Probabilidades Diagnóstica (DOR), como medida alternativa de interés respecto a la frecuencia, para realizar la selección de los patrones interesantes. Por último, presentamos un original método para obtener un subconjunto reducido de patrones secuenciales novedosos que representan la evolución temporal sorpresiva del estado clínico del paciente, a los que llamaremos como Jumping Diagnostic Odds Ratio Sequential Patterns (JDORSP). Utilizaremos el DOR para seleccionar aquellos patrones secuenciales que representen un cambio drástico en la evolución del paciente, es decir, patrones que se convierten en un factor de protección cuando extendemos un patrón que era un factor de riesgo, o viceversa. RESULTADOS. Los resultados de las pruebas de clasificación muestran que nuestro enfoque supera a las puntuaciones de gravedad de quemaduras utilizadas actualmente por los médicos siguiendo la puntuación de Brier, y hasta donde sabemos, este sería el primer trabajo donde patrones secuenciales multivariantes se utilizan como predictores de mortalidad en la UCI. Respecto a la utilización de diferentes discretizaciones, que conozcamos, ningún estudio previo ha realizado esta comparación utilizando patrones secuenciales específicamente. El mejor rendimiento con la clasificación se ha obtenido con la discretización automática UCPD. También obtenemos un resultado aceptable con la discretización experta, superando a muchos algoritmos de discretización automática. Mediante la evaluación de la consistencia, hemos reducido aún más el número de patrones secuenciales, encontrado patrones uniformemente distribuidos por toda la base de datos de pacientes. Respecto a la utilización de una métrica estadística, el DOR, como medida de interés para reducir el número de patrones secuenciales y seleccionar sólo los más discriminatorios, con la discretización experta, la mayor especificidad se alcanza utilizando directamente el valor del DOR para seleccionar los patrones. Esta es, hasta donde sabemos, la primera vez que algunos de estos enfoques han sido propuestos y comparados en la literatura científica. Por último, respecto a los novedosos patrones JDORSP propuestos, que conozcamos, esta es la primera vez en la que el DOR y los patrones secuenciales se utilizan de esta manera. Destacamos la drástica reducción de patrones secuenciales con respecto al estado actual de la técnica, permitiendo realizar una revisión manual por expertos médicos de la sorpresividad y relevancia de los patrones descubiertos. Así, el hecho más interesante encontrado es la alta sorpresividad en los patrones secuenciales que inicialmente tienen un factor de riesgo, y sus extensiones se convierten en un factor de protección, es decir, pacientes que se recuperan a los pocos días de estar en alto riesgo de morir.

    • English

      Our research proposal is based on patients with severe burns who have been admitted to the ICU and whose evolution has been recorded daily. Some clinical parameters available from the arrival of the patient, such as age or the extent of the burn, allow an initial assessment of the severity and help to predict the estimated survival on admission. However, the study of the evolution of other clinical parameters recorded during the first 5 days of ICU stay (pH, diuresis, base excess, ...) can help to define objectives and to assess the evolution and treatment response. This thesis proposes the generation of potential knowledge by observing the temporal evolution of these variables, in such a way that it could be possible to predict the survival of a patient or suggest new ideas to physicians about the behavior of these variables. METHODS. A knowledge discovery process is initially defined with the following 4 steps: 1) discretization of temporal attributes, 2) multivariate sequential pattern mining, 3) post-processing, filtering as interesting patterns those that are discriminative, and subsequently applying a compressed representation of these patterns, 4) classification of patient survival with interpretable models. Next, we will compare how different discretization methods affect the classification and we will try to reduce the number of sequential patterns used as predictors in the classifiers, making an evaluation of their consistency. In addition, we propose the use of a statistical indicator widely used in epidemiological studies, the Diagnostic Odds Ratio (DOR), as an alternative interestingness measure with respect to frequency, to select interesting patterns. Finally, we present an original method to obtain a reduced subset of novel sequential patterns that represent the surprising temporal evolution of the patient's clinical status, which we will call Jumping Diagnostic Odds Ratio Sequential Patterns (JDORSP). We will use the DOR to select sequential patterns that represent a dramatic change in the patient's evolution, that is, patterns that become a protective factor when we extend a pattern that was a risk factor, or vice versa. RESULTS. The results of the classification tests show that our approach outperforms the burn severity scores currently used by physicians in terms of Brier score, and to the best of our knowledge, this would be the first paper where multivariate sequential patterns are used as mortality predictors in ICU. Regarding the use of different discretization techniques, to our knowledge, no previous study has made this comparison using sequential patterns specifically. The best performance with classification has been obtained with the automatic UCPD discretization. We also get an acceptable result with expert discretization, outperforming many automatic discretization algorithms. By evaluating consistency, we have further reduced the number of sequential patterns, finding patterns uniformly distributed within the patient database. Regarding the use of the DOR statistic to reduce the number of sequential patterns and select only the most discriminative ones, with expert discretization, the highest specificity is achieved by directly using the DOR value to select patterns. This is, to our knowledge, the first time that some of these approaches have been proposed and compared in the scientific literature. Finally, regarding the proposed novel JDORSP patterns, to the best of our knowledge this is the first time that the DOR and sequential patterns have been used in this way. We highlight the drastic reduction in sequential patterns with respect to the current state of the art, allowing manual review by medical experts of the surprisingness and relevance of the patterns discovered. Thus, the most interesting fact is the high surprisingness in sequential patterns that initially have a risk factor, and their extensions become a protection factor, that is, the patients that recover after several days of being at high risk of dying.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno