Ir al contenido

Documat


Resumen de Una nueva metodología basada en gradient boosting para la estimación de fronteras de mejores prácticas

María Dolores Guillén García

  • Dentro de los campos de la econometría y la ingeniería de producción, un tema de interés es la evaluación de la eficiencia técnica de entidades a partir de la estimación de la frontera de mejores prácticas, la cual delimita el conjunto de posibilidades de producción o tecnología. Por definición, una tecnología debe satisfacer un conjunto de postulados microeconómicos. Del mismo modo, un estimador válido de una tecnología debe cumplir el mismo conjunto de axiomas. Dentro de los enfoques no paramétricos, destacan el Data Envelopment Analysis (DEA) y el Free Disposal Hull (FDH). Ambas metodologías son deterministas y cumplen el principio de mínima extrapolación. Esto implica que son susceptibles a errores de medición debido al ruido, y al sobreajuste de la muestra de datos usada para generar el estimador, limitando su capacidad de inferencia fuera de la muestra de datos.

    La literatura reciente ha explorado el uso de técnicas de aprendizaje automático para mejorar la estimación de fronteras de producción. Sin embargo, no se ha explorado el uso de técnicas de boosting, una metodología de aprendizaje automático basada en la combinación secuencial de múltiples modelos débiles para mejorar la predicción. En esta Tesis se desarrolla una nueva metodología basada en el algoritmo de aprendizaje automático Gradient Tree Boosting para la estimación de fronteras de producción. Como se señala nada más comenzar, la Tesis es un compendio de tres artículos publicados, recogidos en los Apéndices A, B y C. En el primero de ellos, se adapta el algoritmo original de modo que el estimador resultante cumpla con los axiomas de monotonicidad y libre disponibilidad (necesarios para los estimadores de fronteras de producción), dando lugar al algoritmo EATBoosting. En el segundo, se muestra cómo calcular diferentes medidas de eficiencia técnica utilizando como base la tecnología generada por el nuevo estimador. Sin embargo, desde un punto de vista computacional, los problemas de optimización asociados al nuevo enfoque presentan miles de variables de decisión, lo que dificulta su resolución. Para hacer frente a este problema, también se propone una aproximación heurística a las medidas de eficiencia exactas. Finalmente, para facilitar el uso de esta nueva metodología por parte de otros investigadores y profesionales, se ha desarrollado una librería en R denominada "BoostingDEA", que incorpora las funcionalidades principales de DEA, FDH y EATBoosting.

    La principal ventaja del nuevo enfoque radica en su capacidad para abordar el problema del sobreajuste. A diferencia de las técnicas tradicionales, nuestra metodología no subestima sistemáticamente la ineficiencia real de las Decision Making Units (DMUs), funcionando más como una herramienta inferencial que meramente descriptiva. Esto permite un mayor poder discriminatorio, conduciendo a una identificación más precisa de las ineficiencias, mejorando a FDH en los escenarios simulados tanto en error cuadrático medio como en sesgo. Además, nuestro enfoque proporciona una posible solución al problema de la maldición de la dimensionalidad, presente cuando la relación entre el número de DMUs y el número de variables es baja. La aplicación de EATBoosting en estos casos permite realizar un análisis de eficiencia más sólido y preciso.


Fundación Dialnet

Mi Documat