Ir al contenido

Documat


Visualization of Skewed Data: A Tool in R

  • RAYDONAL OSPINA [1] ; ANTONIO MARCOS LARANGEIRAS [2] ; ALEJANDRO C. FRERY [2]
    1. [1] Universidade Federal de Pernambuco

      Universidade Federal de Pernambuco

      Brasil

    2. [2] Universidade Federal de Alagoas

      Universidade Federal de Alagoas

      Brasil

  • Localización: Revista Colombiana de Estadística, ISSN-e 2389-8976, ISSN 0120-1751, Vol. 37, Nº. 2, 2014, págs. 399-417
  • Idioma: inglés
  • DOI: 10.15446/rce.v37n2spe.47945
  • Títulos paralelos:
    • Visualización de datos sesgados: una herramienta en R
  • Enlaces
  • Resumen
    • español

      Despu\es de discutir las principales características del histograma y de un número de variables en el boxplot, se presento una herramienta de visualisación específicamente diseñada para el tratamiento de datos. La idea es usar varios tipos de boxplots (el clásico, el cual es adaptado para la consideración de sesgo de los datos, el boxplot trasladado, y el gráfico de cajas de percentiles), el gráfico violin, y el histograma con un estimador no paramétrico de la densidad. Los gráficos son presentados de forma que faciliten la extracción de información adicional. Se muestra como una buena cantidad de información que puede ser extraída a través de ejemplos de imágenes de radar de apertura sintética. Se presenta su implementacón en R basada en funciones actualmente disponibles.

    • English

      After discussing the main characteristics of the histogram and of a number of variations in the boxplot, this work presents a visualization tool specifically tailored to deal with skewed data. The idea is to use various types of boxplots (the classical one, which is tuned for skewness of the data, the shifting boxplot, and the box-percentile plot), the violin plot, and the histogram with a nonparametric estimate of the density overlay. The plots are presented in such a way that they facilitate the extraction of additional information from each one. We show that a good deal of information can be extracted from the inspection of the output using example data from synthetic aperture radar images. We provide an implementation in R based on functions already available.

  • Referencias bibliográficas
    • Adams, R. E. W.,Brown, W. E.,Culbert, T. P.. (1981). 'Radar mapping, archeology, and ancient Maya land use'. Science. 213. 1457-1468
    • Arvidson, R.,Schulte, M.,Kwok, R.,Curlander, J.,Elachi, C.,Ford, J. P.,Saunders, R.. (1988). 'Construction and analysis of simulated Venera...
    • Brys, G.,Hubert, M.,Struyf, A.. (2004). 'A robust measure of skewness'. Journal of Computational and Graphical Statistics. 13. 996-1017
    • Cassetti, J.,Gambini, J.,Frery, A. C.. (2013). Parameter estimation in SAR imagery using stochastic distances. 'Proceedings of The 4th...
    • Chambers, J.,Cleveland, W.,Kleiner, B.,Tukey, P.. (1983). 'Graphical methods for data analysis'. The Wadsworth Statistics/Probability...
    • Doulgeris, A. P.,Anfinsen, S. N.,Eltoft, T.. (2011). 'Automated non-Gaussian clustering of polarimetric synthetic aperture radar images'....
    • Esty, W. W.,Banfield, J. D.. (2003). 'The box-percentile plot'. Journal of Statistical Software. 8.
    • Freedman, D.,Diaconis, P.. (1981). 'On the histogram as a density estimator: l2 theory'. Zeitschrift für Wahrscheinlichkeitstheorie...
    • Freitas, C. C.,Frery, A. C.,Correia, A. H.. (2005). 'The polarimetric G distribution for SAR data analysis'. Environmetrics. 16. 13-31
    • Frery, A. C.,Correia, A. H.,Freitas, C. C.. (2007). 'Classifying multifrequency fully polarimetric imagery with multiple sources of statistical...
    • Frery, A. C.,Müller, H.-J.,Yanasse, C. C. F.,Sant'Anna, S. J. S.. (1997). 'A model for extremely heterogeneous clutter'. IEEE...
    • Hintze, J. L.,Nelson, R. D.. (1998). 'Violin plots: A box plot-density trace synergism'. The American Statistician. 52. 181
    • Hubert, M.,Vandervieren, E.. (2008). 'An adjusted boxplot for skewed distributions'. Computational Statistics & Data Analysis....
    • Marmolejo, R. F.,Tian, T. S.. (2010). 'The shifting boxplot: A boxplot based on essential summary statistics around the mean'. International...
    • McGill, R.,Tukey, J. W.,Larsen, W. A.. (1978). 'Variations of boxplots'. The American Statistician. 32. 12-16
    • Mejail, M. E.,Jacobo-Berlles, J.,Frery, A. C.,Bustos, O. H.. (2003). 'Classification of SAR images using a general and tractable multiplicative...
    • Moreira, A.,Prats-Iraola, P.,Younis, M.,Krieger, G.,Hajnsek, I.,Papathanassiou, K. P.. (2013). 'A tutorial on synthetic aperture radar'....
    • Mott, H.. (2007). Remote Sensing with Polarimetric Radar. Wiley-IEEE Press.
    • Mugdadi, A. R.,Ahmad, I. A.. (2004). 'A bandwidth selection for kernel density estimation of functions of random variables'. Computational...
    • Parzen, E.. (1962). 'On estimation of a probability density function and mode'. The Annals of Mathematical Statistics. 33. 1065-1076
    • Pearson, K.. (1895). 'Contributions to the mathematical theory of evolution II: skew variation in homogeneous material'. Philosophical...
    • (2013). R Core Team, R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. Vienna.
    • Rosenblatt, M.. (1956). 'Remarks on some nonparametric estimates of a density function'. The Annals of Mathematical Statistics. 27....
    • Scott, D. W.. (1979). 'On optimal and data-based histograms'. Biometrika. 66. 605-610
    • Silverman, B. W.. (1986). Density Estimation for Statistics and Data Analysis. Chapman & Hall.
    • Sturges, H. A.. (1926). 'The choice of a class interval'. Journal of the American Statistical Association. 21.
    • Tufte, E. R.. (2001). The Visual Display of Quantitative Information. 2. Graphics Press.
    • Tukey, J. W.. (1977). Exploratory Data Analysis. Addison-Wesley.
Los metadatos del artículo han sido obtenidos de SciELO Colombia

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno