Ir al contenido

Documat


Machine Learning for the Evolutionary Analysis of Breast Cancer

  • Autores: Edwin Joao Merchán Carreño, Rodrigo Martínez Béjar Árbol académico, Alexander Mackenzie Rivero, Alberto Rodríguez Rodríguez
  • Localización: Journal of Science and Research: Revista Ciencia e Investigación, ISSN 2528-8083, Vol. 3, Nº. Extra 1, 2018 (Ejemplar dedicado a: III Congreso Internacional de Tendencias Tecnólogicas - CITT 2017), págs. 44-49
  • Idioma: inglés
  • DOI: 10.26910/issn.2528-8083vol3issCITT2017.2018pp44-49
  • Títulos paralelos:
    • Aprendizaje automático para el análisis evolutivo de Cáncer de mama
  • Enlaces
  • Resumen
    • español

      El uso del aprendizaje automático permite la creación de un modelo predictivo de datos, como resultado del análisis en un conjunto de datos con 286 instancias y nueve atributos pertenecientes al Instituto de Oncología del Centro Médico Universitario.Ljubljana. En función de esta situación, los datos se preprocesan aplicando técnicas inteligentes de análisis de datos para eliminarlos valores perdidos, así como la evaluación de cada atributo que permite la optimización de resultados. Utilizamos varios algoritmos de clasificación incluyendo ́arboles J48, bosque aleatorio, bayes net, bayes naive, tabla de decisiones, para obtener uno que, dadas las características de los datos, permita el mejor porcentaje de clasificación y por lo tanto una mejor matriz de confusión, utilizando 66 % de los datos para aprendizaje y 33 % para validar el modelo. Con este modelo, se obtiene un predictor con una eficacia del 71,134 % para estimar o no la recurrencia del cáncer de mama.

    • English

      The use of machine learning allows the creation of a predictive data model, as a result of the analysis in a data set with286 instances and nine attributes belonging to the Institute of Oncology of the University Medical Center. Ljubljana. Based onthis situation, the data are preprocessed by applying intelligent data analysis techniques to eliminate missing values as well as theevaluation of each attribute that allows the optimization of results. We used several classification algorithms including J48 trees,random forest, bayes net, naive bayes, decision table, in order to obtain one that given the characteristics of the data, would allowthe best classification percentage and therefore a better matrix of confusion, Using 66 % of the data for learning and 33 % forvalidating the model. Using this model, a predictor with a 71,134 % effectiveness is obtained to estimate or not the recurrence ofbreast cancer

  • Referencias bibliográficas
    • Citas COE, J. (2012). Performance comparison of naïve bayes and j48 classi cation algorithms. International Journal of Applied Engineering...
    • Coleman, M. P., Quaresma, M., Berrino, F., Lutz, J.-M., De Angelis, R., Capocaccia, R., Baili, P., Rachet, B., Gatta, G., Hakulinen, T., et...
    • Dimitoglou, G., Adams, J. A., and Jim, C. M. (2012). Comparison of the c4. 5 and a naïve bayes classi er for the prediction of lung cancer...
    • Dunham, M. H. (2006). Data mining: Introductory and advanced topics. Pearson Education India. Gharehchopogh, F. S. and Lot , Y. (2013). Machine...
    • Kohavi, R. (1995). The power of decision tables. In European conference on machine learning, pages 174– 189. Springer.
    • Liu, H. and Motoda, H. (1998). Feature extraction, construction and selection: A data mining perspective, volume 453. Springer Science &...
    • Livingston, F. (2005). Implementation of breiman’s random forest machine learning algorithm, in ece591q machine learning conference.
    • Patil, T. R. and Sherekar, S. (2013). Performance analysis of naive bayes and j48 classi cation algorithm for data classi cation. International...
    • Quadrianto, N., Petterson, J., Caetano, T. S., Smola, A. J., and Vishwanathan, S. (2010). Multitask learning without label correspondences....
    • Quinlan, J. (1993). C4. 5: Programs for machine learning morgan kaufmann publishers san francisco. CA Google Scholar.
    • Rimey, R. D. and Brown, C. M. (1992). Where to look next using a bayes net: Incorporating geometric relations. In European Conference on Computer...
    • Witten, I. H., Frank, E., Hall, M. A., and Pal, C. J. (2016). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.
    • Zavoral, M., Suchanek, S., Zavada, F., Dusek, L., Muzik, J., Seifert, B., and Fric, P. (2009). Colorectal cancer screening in europe. World...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno