En este trabajo se plantea una metodología alternativa a la técnica de Mínimos Cuadrados Ordinarios (MCO), en la que se considera que para obtener los coeficientes del modelo lineal, se podrían considerar distintos tipos de residuos (como distancias al hiperplano de regresión), así como distintos tipos de criterios de estimación. Planteamos un modelo común, que permite reescribir los modelos clásicos como una subclase de estos. Este modelo flexible, llamado en la literatura problema de la mediana ordenada, cuando fijamos un tipo de residuo, modela no sólo al caso (particular) de los MCO, sino a una multitud de casos vagamente estudiados en la literatura como los coeficientes obtenidos minimizando la mediana de los errores al cuadrado, o el 20% de los errores al cuadrado más altos, o más bajos, etc. Puesto que una práctica común a la hora de realizar cualquier análisis estadístico debe ser la de realizar en primer lugar una exploración de los datos con el objetivo de encontrar datos anómalos que puedan distorsionar los análisis posteriores, presentaremos una aplicación de nuestro enfoque a la detección de outliers (observaciones que empeoran la bondad del modelo).
It is usual in any statistical analysis to explore the data to detect anomalous observations to avoid false conclusions. In multiple linear regression, those data may produce that the model does not adjust to reality and then, if the goal is to provide predictions, they might be non realistic. Here, we propose an alternative methodology to the standard Least Squared Error (LSE) technique, that considers that instead of minimizing the overall sum of the squared errors, minimizing a weighted sum of the nondecreasing ordered squared errors. This flexible modelis usually called Ordered Median Problem or Ordered Weighted Averaging optimization problema, and that not only considers as a particular case the LSE criteria, but many others that are vaguely studied in the literature as the minimization of the sum of the median squared errors, the sum of the k-largest squared errors, amongs infinitely many other criteria.
As a particular case, this model allows to detect those observations that would get worse goodness of fit of the estimation linear regression model.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados