Juan José Cuadrado Gallego , Daniel Rodríguez García , Miguel Ángel Sicilia Urbán
Los modelos paramétricos de estimación del esfuerzo de desarrollo de software utilizan bases de datos de proyectos pasados para ajustar la función del esfuerzo requerido. El uso de bases de datos cuyas fuentes son heterogéneas hace que los modelos obtenidos mediante regresión a menudo tengan errores medios excesivamente altos, debido a que los datos son muy diferentes entre sí en cuanto a su magnitud. Para mejorar esta situación se ha propuesto el dividir el dominio de las entradas en varios segmentos, de modo que se obtenga un modelo de regresión con diferentes parámetros para cada uno de ellos. En este artículo se describe cómo se pueden utilizar algoritmos conocidos de agrupamiento de manera recursiva para obtener ese tipo de modelo segmentado. Concretamente, se utiliza la base de datos ISBSG y el algoritmo EM como demostración de los resultados que pueden obtenerse mediante dicha técnica.
Parametric sofware effort estimation models use historical project databases to adjust the parameters of the required effort function. The use of databases with data coming from heterogeneous sources often entail that the resulting models are subject to excessively high mean errors, due to the fact that data are widely diverging in magnitude. In order to improve this situation, the segmentation of the input domain has been proposed, so that a regression model with different parameters is obtained for each segment. In this paper, the use of well-known clustering algorithms in a recursive way is described as a technique to obtain segmented models of the kind mentioned. Concretely, the ISBSG database and the EM algorithm are use as a demonstration of the results that can be obtained through that technique.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados