Resumen de Clasificación y predicción con datos de alta dimensión: Aplicación del algoritmo BOOSTING en el desarrollo de biomarcadores

Rosario Madero, E. Pérez Fernández, Belén San José Valiente

Los estudios de genomica y proteomica generan datos de alta dimension como niveles de expresion de miles de genes (PDR-rt, microarrys) o las intensidades de un gran numero de picos (espectrometra de masas). Estos datos recogen variables muy correladas y generalmente se dispone de muestras peque~nas para tratar de obtener buenos sistemas de clasi cacion o prediccion. Los metodos estadsticos tradicionales (analisis discriminante, regresion logsitica) con frecuencia no son e cientes debido a problemas de tama~no muestral y sobreajuste. Una estrategia que mejora los resultados es el proceso llamado BOOSTING, que aplica un clasi cador de manera secuencial a sucesivas versiones de la muestra obtenidas tras reponderar los casos y combinando los resultados de muchos clasi cadores mediocres en un resultado potente. Nosotros aplicamos diferentes metodos de Boosting a datos que representan expresiones de protenas en muestras tumorales usando espectrometra de masas por el metodo MALDI-TOF.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: