Madrid, España
El estudio del churn rate por parte de las empresas, como porcentaje de clientes o suscriptores que dejan de utilizar sus productos o servicios durante un período determinado, resulta una práctica habitual dentro de las mismas. Dicho estudio permite detectar patrones de comportamiento asociados a si el cliente quiere permanecer o no. Dicha detección de patrones se puede efectuar mediante el empleo de técnicas de Machine Learning asociado a la utilización de modelos de aprendizaje supervisado. Esta detección de abandono permitirá a la compañía abordar las estrategias de retención que considere pertinentes con el objetivo de evitar pérdidas económicas no deseadas. Este trabajo presenta el caso de estudio de la empresa de telecomunicaciones Orange, datos procedentes de la competición SIDKDD 2009.
Con el objetivo de contrarrestar el carácter desequilibrado de los datos y, por tanto, favorecer la captación de marcha de clientes, se plantean dos técnicas: el uso del algoritmo SMOTE y una versión propia de un ensamble de submuestras. Tras analizar los resultados, se constata que el entrenamiento de los algoritmos con un set de datos equilibrado permite mejorar considerablemente la captación de la marcha de los clientes a costa de u cierta penalización en la precisión del modelo.
Finalmente, se incorpora un abanico de ensamble de estimadores que registra toda posible combinación de las predicciones de los modelos predictivos utilizados, de tal manera que se obtengan distintos balances entre precisión y captación de la marcha de clientes.
The study of the churn rate by companies, as a percentage of customers or subscribers who stop using their products or services during a certain period, is a common practice within a company. This study allows detecting behaviour patterns associated with whether the customer wants to stay or not. This detection of patterns can be done by using Machine Learning techniques related to the use of supervised learning models. This detection of abandonment will allow the company to address the retention strategies it considers relevant to avoid unnecessary economic losses. This paper presents the case study of the telecommunications company Orange, data from the SIDKDD 2009 competition.
In order to compensate the unbalanced nature of the data and, therefore, to promote the detection of clients leaving, two techniques are proposed: the use of the SMOTE algorithm and a customized version of a subsample assembly. Having analysed the results, it has been found that the training of the algorithms with a balanced dataset allows to improve considerably the capture of the customers leaving at expense of a certain penalty in the accuracy of the model. Finally, a range of estimate assemblies is incorporated so as it records every possible combination of the predictions of the predictive models used, in such a way that different balances are obtained between accuracy and detection of customer leaving.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados