Esta tesis se centra en derivar métodos robustos o dispersos bajo la perspectiva de la optimización para problemas que tradicionalmente se engloban en los campos de la Estadística o de la Investigación Operativa. Concretamente, el objetivo de esta tesis doctoral es fusionar técnicas de optimización con conceptos estadísticos para desarrollar metodologías innovadorass que puedan mejorar a los métodos ya existentes y que aúnen las matemáticas teóricas con los problemas de la vida real. Por una parte, los métodos robustos propuestos facilitarán un nuevo enfoque sobre el modelado y la interpretación de problemas clásicos del área de la Investigación Operativa, produciendo soluciones que sean resistentes a varios tipos de incertidumbre. Por otra parte, las estrategias dispersas desarrolladas para resolver problemas notorios del área de Estadística tendrán forma de Problemas No Lineales Mixtos (es decir, problemas de optimización con algunas variables enteras o binarias y función objetivo no lineal, denotados MINLP a partir de ahora). Se mostrará que los métodos propuestos no solamente son manejables computacionalmente, sino que además realzan la interpretabilidad y obtienen una buena calidad de predicción. Específicamente, el Capítulo 1 se centra en descubrir causalidades potenciales en series temporales multivariantes. Esto se lleva a cabo formulando el problema como un MINLP donde las restricciones modelan distintos aspectos de la dispersión, incluyendo restricciones que no permiten la aparición de relaciones espúreas en el modelo. El método muestra un buen rendimiento en términos de poder de predicción y de recuperación del modelo original. Análogamente, el objetivo del Capítulo 2 es descubrir cuáles son los predictores relevantes en un problema de regresión lineal, sin llevar a cabo tests de significación ya que éstos pueden fallar si existe multicolinealidad. Para ello, se formulan MINLPs que restringen los métodos de estimación seleccionados, añadiendo restricciones que miden la importancia de los predictores y que están diseñadas para evitar los problemas que produce la multicolinearidad en los datos. Los modelos restringidos muestran un buen equilibrio entre interpretabilidad y precisión. Por otra parte, en el Capítulo 3 se generaliza el problema clásico del vendedor de periódicos, asumiendo demandas correladas. En particular, una estrategia de inventario robusta, donde no se asumen hipótesis distribucionales sobre la demanda, se formula como un problema de optimización. Para el modelado de dicho problema se hace uso de técnicas que ligan conceptos estadísticos con conjuntos de incertidumbre. Las soluciones obtenidas son robustas ante la presencia de ruido con alta variabilidad en los datos, mientras evitan el exceso de conservadurismo. En el Capítulo 4 se extiende esta formulación para series temporales multivariantes. El escenario es, además, más complejo: no solamente se busca fijar los niveles de producción, sino que se quiere determinar la localización de instalaciones y la asignación de clientes a las mismas. Empíricamente se muestra que, para diseñar una cadena de suministros eficiente, es importante tener en cuenta la correlación y la variabilidad de los datos multivariantes, desarrollando técnicas basadas en los datos que hagan uso de métodos de predicción robustos. Un examen más exhaustivo de las características específicas del problema y de los conjuntos de incertidumbre se lleva a cabo en el Capítulo 5, donde se estudia el problema de selección de portfolios con costes de transacción. En este capítulo se obtienen resultados teóricos que relacionan los costes de transacción con diferentes maneras de protección ante la incertidumbre de los retornos. Como consecuencia, los resultados numéricos muestran que calibrar la penalización de los costes de transacción produce resultados que son resistentes a los errores de estimación.
This thesis is focused on deriving robust or sparse approaches under an optimization perspective for problems that have traditionally fell into the Operations Research or the Statisics fields. In particular, the aim of this Ph.D. dissertation is to merge optimization techniques with statistical concepts, leading to novel methods that may outperform the classic approaches and bridge theoretical mathematics with real life problems. On one hand, the proposed robust approaches will provide new insights into the modelling and interpretation of classic problems in the Operations Research area, yielding solutions that are resilient to uncertainty of various kinds. On the other hand, the sparse approaches derived to address some up-to-the-minute topics in Statistics will take the form of Mixed Integer Non-Linear Programs (i.e. optimization problems with some integer or binary variables and non linear objective function, denoted as MINLP thereafter). The proposed methods will be shown to be computationally tractable and to enhance interpretability while attaining a good predictive quality. More specifically, Chapter 1 is focused on discovering potential causalities in multivariate time series. This is undertaken by formulating the estimation problem as a MINLP in which the constraints model different aspects of the sparsity, including constraints that do not allow spurious relationships to appear. The method shows a good performance in terms of forecasting power and recovery of the original model. Analogously, in Chapter 2 the aim is to discover the relevant predictors in a linear regression context without carrying out significance tests, since they may fail in the presence of strong collinearity. To this aim, the preferred estimation method is tightened, deriving MINLPs in which the constraints measure the significance of the predictors and are designed to avoid collinearity issues. The tightened approaches attain a good trade-off between interpretability and accuracy. In contrast, in Chapter 3 the classic newsvendor problem is generalized by assuming correlated demands. In particular, a robust inventory approach with distribution-free autoregressive demand is formulated as an optimization problem, using techniques that merge statistical concepts with uncertainty sets. The obtained solutions are robust against the presence of noises with high variability in the data while avoiding overconservativeness. In Chapter 4 this formulation is extended to multivariate time series in a more complex setting, where decisions over the location-allocation of facilities and their production levels are sought. Empirically, we illustrate that, in order to design an efficient supply chain or to improve an existent one, it is important to take into account the correlation and variability of the multivariate data, developing data-driven techniques which make use of robust forecasting methods. A closer examination of the specific characteristics of the problem and the uncertainty sets is undertaken in Chapter 5, where the portfolio selection problem with transaction costs is considered. In this chapter, theoretical results that relate transaction costs with different ways of protection against uncertainty of the returns are derived. As a consequence, the numerical experiments show that calibrating the transaction costs term yields to results that are resilient to estimation error.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados