Ir al contenido

Documat


Contribuciones al análisis multivariante no lineal

  • Autores: Guillermo Antonio Correa Londoño
  • Directores de la Tesis: Carmelo Antonio Ávila Zarza (dir. tes.) Árbol académico, Purificación Galindo-Villardón (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Salamanca ( España ) en 2008
  • Idioma: español
  • Tribunal Calificador de la Tesis: José Luis Vicente Villardón (presid.) Árbol académico, Carmen Patino Alonso (secret.) Árbol académico, David Almorza Gomar (voc.) Árbol académico, Lina Vicente Herranz (voc.) Árbol académico
  • Enlaces
  • Resumen
    • español

      Se ha desarrollado un método de cuantificación óptima basado en la minimización de la suma de las interdistancias cuadráticas entre las categorías cuantificadas de las variables. Esto garantiza que las categorías más frecuentemente asociadas reciban cuantificaciones más similares. Este sistema de cuantificación, al no estar basado en la reducción de la dimensionalidad del sistema multivariante, genera un único conjunto de cuantificaciones. Estas son las principales ventajas de este sistema, denominado CUANTIFICA, en relación al sistema Gifi de análisis multivariante no lineal. En adición a los niveles de escalamiento clásicos (Numérico, Ordinal y Nominal), CUANTIFICA soporta niveles de Escalamiento Numérico Flotante y Ordinal Flotante, los cuales permiten manejar categorías del tipo �No sabe/No responde�, asignándoles una cuantificación libre, manteniendo el nivel de escalamiento base para las demás categorías de la correspondiente variable. Además del desarrollo teórico, se han desarrollado los algoritmos computacionales y la interfaz gráfica para generar las cuantificaciones. Como aporte adicional, se elaboró una metodología para la obtención de representaciones biplot de matrices con datos faltantes. Se parte de la matriz de correlaciones por pares, construida con la información disponible para cada par de variables, cuya descomposición en valores y vectores propios permite obtener los marcadores columna. Seguidamente, se obtienen los marcadores fila usando regresiones con ponderación cero para los datos faltantes. Se han elaborado las rutinas computacionales y las interfaces gráficas necesarias tanto para la obtención de marcadores vectoriales como para la elaboración de las representaciones. Puesto que las representaciones generadas con base en esta metodología constituyen una generalización de las representaciones biplot que preservan la métrica de las columnas, se les ha denominado GCMP-Biplot (Generalized Column Metric Preserving Biplot). Finalmente, se expone el desempeño de las técnicas a través del análisis de una población de pacientes con Cardiopatía Isquémica.

    • English

      We have developed an optimal quantification method, based on the minimization of the sum of the quadratic interdistances between the quantified categories of the variables. This method guarantees that the more frequently associated categories have the more similar quantifications. Given that this method of quantification is not based on dimensionality reduction, it generates a single set of quantifications. These are the main advantages of this method called CUANTIFICA over the Gifi-system of non-linear multivariate analysis. In addition to the classical scaling levels (Numerical, Ordinal, Nominal), CUANTIFICA support Floating Numerical and Floating Ordinal scaling levels, which are suited to handle categories of the type �Don�t know/No answer�. These scaling levels assign a free quantification the floating category, keeping a numerical or ordinal scaling level for the remaining categories of the variable. In addition to the theory, we have developed some computational algorithms and a graphical interface to generate quantifications. As and additional contribution, we developed a methodology to generate the biplot display of a matrix with missing data. We start with a matrix of pairwise correlations, which is built by using all the available information for each pair of variables. The eigendecomposition of this correlation matrix allows getting the column markers for the incomplete matrix. After that, we achieve the file markers by using regressions with zero weighting for the missing values. We have developed the computational algorithms and the graphical interfaces both for calculating the vector markers and for drawing the graphical displays. Given that this display generalizes the one that preserves the column metric, we have called it Generalized Column Metric Preserving Biplot or GCMP-Biplot. Finally, we show the performance of the developed techniques by analyzing an ischemic cardiopathy patient population.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno