Las comparaciones de variables surgen con naturalidad en todas las actividades humanas: es muy frecuente cotejar caracteristicas, buscar la similitud entre dos o más grupos de variab les o estudiar relaciones funcionales entre atributos. La estadística, en general, se ha encargado a lo largo de su historia de producir herramientas tecnológicas para que fuese posible resolver estos problemas.
En el análisis multivariante en particular, se han desarrollado técnicas para captar la similitud de dos grupos de variables, o para explicar de alguna manera un grupo a partir del otro. La regresión multivariante, el análisis de componentes principales, el Análisis Correlaciones Canónicas (ACC) y la regresión de Mínimos Cuadrados Parcia les (PLS) son ejemplos en ese sentido. La mayoría de estos métodos, sin embargo, se acerca al problema desde una perspectiva lineal. Esto es, encontrar una recta que resuma Ia distribución conjunta.
Si bien el análisis de componentes principales es fundamental para implementar muchos métodos lineales multivariantes, existen situaciones donde su utilidad es limitada debido a que los datos pueden presentar una estructura que no es lineal. Es decir que el mejor resumen de la distribución no es una recta sino una curva. Esta circunstancia, motivó generalizaciones de las componentes principales al ámbito no lineal, como por ejemplo los trabajos de .Hastie y Stuetzle (1989), Kégl et al. (2000) y Del icado (2001) que definen curvas principales con procedimientos no paramétricos. Estas curvas respetan características propias de las componentes principales y apuntan a encontrar la variación conjunta de todas las variables en juego. Dejan abierto el camino, entonces, hacia Ia búsqueda de una medida que capture la relación no lineal entre dos conjuntos de variables. En definitiva entonces, el problema que se plantea en este trabajo de tesis es encontrar una herramienta que sea capaz de medir la variación conjunta de dos partes de un sector aleatorio, desde una perspectiva general.
Esta tesis está estructurada en 6 capítulos y un apéndice. El capítulo 2 presenta un resumen de algunos procedimientos que son antecedentes del presente trabajo; éste capítulo pretende mostrar los alcances del estudio de la relación entre grupos de variables en la actualidad. Contiene una reseña del análisis de componentes principales, correlaciones canónicas, búsqueda de variables latentes en la regresión de mínimos cuadrados parciales, generalizaciones de las componentes principales a curvas y definiciones anteriores de asociaciones no lineales en el plano. En el capítulo 3, se incorpora una nueva definición de curvas principales desde una perspectiva Bayesiana. En el capítulo 4, se incluyen dos nuevas definiciones para medir la asociación de dos variables en el plano y su respectiva motivación. Se analizan dos ejemplos y se discute las características de las medidas definidas a la luz de requisitos presentados en publicaciones anteriores. En el capítulo 5 se generalizan los conceptos de correlaciones canónicas y variables latentes para dos conjuntos de variables en un espacio de dimensión p + q, además se presenta un ejemplo simulado y otro real donde los nuevos procedimientos son aplicados. El último capitulo contiene las conclusiones y las lineas de investigación que se abren a partir de esta tesis. Finalmente en el Anexo se incluye algunos resultados complementarios.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados