Ir al contenido

Documat


Behavior of Some Hypothesis Tests for the Covariance Matrix of High Dimensional Data

  • Autores: Didier Cortez Elizalde, Addy Bolivar-Cime
  • Localización: Revista Colombiana de Estadística, ISSN-e 2389-8976, ISSN 0120-1751, Vol. 45, Nº. 2, 2022, págs. 373-390
  • Idioma: inglés
  • DOI: 10.15446/rce.v45n2.98550
  • Títulos paralelos:
    • Comportamiento de algunas pruebas de hipótesis para la matriz de covarianza de datos de dimensión alta
  • Enlaces
  • Resumen
    • español

      Resumen El estudio de la matriz de covarianza cuando la dimensión de los datos es mucho más grande que el tamaño de la muestra (datos de dimensión alta) es un problema complicado, ya que se tiene una gran cantidad de parámetros desconocidos y pocos datos. Se pueden encontrar en la literatura varias pruebas de hipótesis para la matriz de covarianza, en el contexto de datos de dimensión alta y en el caso clásico (donde la dimensión de los datos es menor que el tamaño de la muestra). Ha sido de interés probar la hipótesis nula de que la matriz de covarianza de datos Gaussianos es igual a la matriz identidad o proporcional a ella, considerando el contexto clásico así como el de dimensión alta. Ya que es importante tener una amplia comparación entre estas pruebas encontradas en la literatura, y para algunas de ellas es difícil tener resultados teóricos acerca de sus potencias, en este trabajo comparamos varias pruebas mediante simulaciones, en términos del tamaño y la potencia de la prueba. También presentamos algunos ejemplos de aplicación con datos de dimensión alta reales encontrados en la literatura.

    • English

      Abstract The study of the structure of the covariance matrix when the dimension of the data is much greater than the sample size (high dimensional data) is a complicated problem, since we have many unknown parameters and few data. Several hypothesis tests for the covariance matrix, in the high dimensional context and in the classical case (where the dimension of the data is less than the sample size), can be found in the literature. It has been of interest to test the null hypothesis that either the covariance matrix of Gaussian data is equal to the identity matrix or proportional to it, considering the cl case as well as the high dimensional context. Since it is important to have a wide comparison between these tests found in the literature, and for some of them it is difficult to have theoretical results about their powers, in this work we compare several tests by simulations, in terms of the size and power of the test. We also present some examples of application with real high dimensional data found in the literature.

  • Referencias bibliográficas
    • Anderson, T. W. (1984). An Introduction to Multivariate Statistical Analysis. John Wiley & Sons, Inc.
    • Bai, Z.,Jiang, D.,Yao, J. F.,Zheng, S. (2009). 'Corrections to LRT on large-dimensional covariance matrix by RMT'. The Annals of Statistics....
    • Cai, T. T.,Ma, Z. (2013). 'Optimal hypothesis testing for high dimensional covariance matrices'. Bernoulli. 19. 2359
    • Chen, S. X.,Zhang, L.-X.,Zhong, P.-S. (2010). 'Tests for high-dimensional covariance matrices'. Journal of the American Statistical...
    • Cortez-Elizalde, D. (2020). Pruebas de hipótesis para la matriz de covarianza poblacional de datos de dimensión alta. Universidad Juárez Autónoma...
    • Hallin, M.,Paindaveine, D. (2006). 'Semiparametrically efficient rank-based inference for shape, i. optimal rank-based tests for sphericity'....
    • Hastie, T.,Tibshirani, R.,Friedman, J. H. (2009). Elements of statistical learning: data mining, inference, and prediction. Springer.
    • John, S. (1971). 'Some optimal multivariate tests'. Biometrika. 58. 123
    • John, S. (1972). 'The distribution of a statistic used for testing sphericity of normal distributions'. Biometrika. 59. 169
    • Johnstone, I. M. (2001). 'On the Distribution of the Largest Eigenvalue in Principal Components Analysis'. The Annals of Statistics....
    • Ledoit, O.,Wolf, M. (2002). 'Some hypothesis tests for the covariance matrix when the dimension is large compared to the sample size'....
    • Li, Z.,Yao, J.. (2016). 'Testing the sphericity of a covariance matrix when the dimension is much larger than the sample size'. Electronic...
    • Ma, Z. (2012). 'Accuracy of the tracy-widom limits for the extreme eigenvalues in white wishart matrices'. Bernoulli. 18. 322
    • Muirhead, R. J. (2005). Aspects of Multivariate Statistical Theory. John Wiley & Sons, Inc.
    • Nagao, H. (1973). 'On some test criteria for covariance matrix'. The Annals of Statistics. 700
    • Rosenwald, A,Wright, G,Chan, W. C,Connors, J. M,Campo, E,Fisher, R. I. (2002). 'The use of molecular profiling to predict survival after...
    • Ross, D. T,Scherf, U,Eisen, M. B,Perou, C. M,Rees, C,Spellman, P. (2000). 'Systematic variation in gene expression patterns in human cancer...
    • Srivastava, M. S. (2005). 'Some tests concerning the covariance matrix in high dimensional data'. Journal of the Japan Statistical...
    • Srivastava, M. S.,Yan aginara, H.,Kubokawa, T. (2014). 'Tests for covariance matrices in high dimension with less sample size'. Journal...
    • Zou, C,Peng, L.,Feng, L.,Wang, Z. (2014). 'Multivariate sign-based high-dimensional tests for sphericity'. Biometrika. 101. 229
Los metadatos del artículo han sido obtenidos de SciELO Colombia

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno