Ir al contenido

Documat


Clasificacion automática simbólica por medio de algoritmos genéticos

  • Fernández-Jiménez, Fabio [1] ; Murillo Fernández, Alex [1]
    1. [1] Universidad de Costa Rica

      Universidad de Costa Rica

      Hospital, Costa Rica

  • Localización: Revista de Matemática: Teoría y Aplicaciones, ISSN 2215-3373, ISSN-e 2215-3373, Vol. 16, Nº. 2, 2009, págs. 283-292
  • Idioma: español
  • DOI: 10.15517/rmta.v16i2.307
  • Enlaces
  • Resumen
    • español

      Se presenta una variante en los m ?todos de clasificaci ?n: un algoritmo gen ?tico para                                     e                   o                    eclasificaci ?n autom ?tica utilizando las herramientas del an ?lisis simb ?lico de datos;          o          a                                         a         oesta implementaci ?n permite solventar los problemas de los m ?todos cl ?sicos de clasi-                   o                                             e       aficaci ?n: obtenci ?n de m ?      o          o        ?nimos locales y dependencia de los tipos de datos con loscuales trabajan: continuos. El m ?todo fue programado en MatLab R y usa un oper-                                   eador interesante de codificaci ?n. Se comparan clases por su inercia intra-clases. Se                               ousaron las siguientes medidas para datos del tipo simb ?lico: medida de disimilitud de                                                        oIchino-Yaguchi, medida de disimilitud de Gowda-Diday, diatancia Eucl ?   ?dea y distanciade Hausdorff.Palabras clave: Clasificaci ?n autom ?tica, an ?lisis simb ?lico, k-means, algoritmos                              o         a         a          ogen ?ticos, optimizaci ?n.    e                  o

    • English

          This paper presents a variant in the methods for clustering: a genetic algorithm forclustering through the tools of symbolic data analysis. Their implementation avoidsthe troubles of clustering classical methods: local minima and dependence of datatypes: numerical vectors (continuous data type).    The proposed method was programmed in MatLab R and it uses an interestingoperator of encoding. We compare the clusters by their intra-clusters inertia. We usedthe following measures for symbolic data types: Ichino-Yaguchi dissimilarity measure,Gowda-Diday dissimilarity measure, Euclidean distance and Hausdorff distance.

  • Referencias bibliográficas
    • Arroyo, J; Maté, C. (2009) “Descriptive distance-based statistics for histogram data”, in: 11th Conference of the International Federation...
    • Billard, L.; Diday, E. (2006) Symbolic Data Analysis: Conceptual Statistics And Data Mining. Wiley, New York.
    • Castillo, W.; González, J.; Trejos, J. (2009) Análisis Multivariado de Datos. Manuscrito en preparación.
    • Larrañaga, P.; Lozado, J. (2002) Estimation of Distribution Algorithms. Kluwer Academic Publishers, Dordrecht.
    • MacQueen, J. (1967) “Some methods for classification and analysis of multivariate observations”, Proc. Fifth Berkeley Symp. on Math. Statist....
    • Pham, D.T.; Karaboga, D. (2000) Intelligent Optimization Techniques. Springer, London.

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno