Santiago, Chile
En los últimos años, numerosas investigaciones han empleado técnicas de machine learning y análisis de datos composicionales en distintos campos de estudio. Sin embargo, su integración en el análisis electoral sigue siendo escasa. Por tal razón, este trabajo integra ambos enfoques aplicando cinco modelos de machine learning: random forest, gradient boosting, support vector machines,k-nearest neighbors, y feed-forward neural networks, para predecir los resultados de las elecciones presidenciales en Colombia a nivel municipal, considerando los datos como composicionales. Específicamente, se pronostica la distribución de votos de cada municipio en el espectro ideológico unidimensional Izquierda-Derecha. De esta forma,se busca no solo mejorar la precisión de las predicciones, sino también generar un avance importante en las metodologías aplicadas al análisis electoral. Los modelos se entrenaron con el70 %de los datos de las elecciones presidenciales entre 2002 y 2022, y se evaluó su rendimiento en el 30% restante. Los algoritmos mostraron desempeños similares entre las transformaciones de cada espectro ideológico con porcentajes de variabilidad entre el 56 % y 94 % en la predicción de la proporción de votos, destacándose el modelo de feedforward neural networks con la transformación log-cociente centrada, que alcanzó los mejores resultados.
In recent years, numerous studies have employed machine learning techniques and compositional data analysis in various fields of study. However, their integration into electoral analysis remains limited. For this reason, this work combines both approaches by applying five machine learning models: random forest, gradient boosting, support vector machines, k-nearest neighbors, and feedforward neural networks, to predict the results of the presidential elections in Colombia at the municipal level, onsidering the data as compositional. Specifically, it forecasts the vote distribution in each municipality along a unidimensional Left-Right ideological spectrum. This approach aims not only to improve prediction accuracy but also to comtribute a significant advancement in methodologies applied to electoral analysis. The models were trained on 70 % of the presidential election data from 2002 to 2022 and evaluated on the remaining 30 %.The algorithms demonstrated similar performance across transformations of each ideological spectrum,with variability percentages between 56 % and 94 % in predicting vote proportions, with the feedforward neural networks model using the centered log-ratio transformation achieving the best results.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados