Salamanca, España
La técnica de segmentación basada en árboles CHAID (Detección Automática de Interacción basada en el Chi Cuadrado, o Chi-Squared Automatic Interaction Detection, por sus siglas en inglés) ha mostrado ser útil para obtener segmentos significativos que sean predictivos de una variable criterio de K categorías (nominal u ordinal).CHAID fue diseñado para detectar, de manera automática, la interacción entre varios predictores categóricos u ordinales para explicar una respuesta categórica, pero esto puede no ser cierto cuando se presenta la paradoja de Simpson. Esto se debe al hecho de que CHAID es un algoritmo de selección hacia adelante basado en conteos marginales. En este artículo proponemos un algoritmo de eliminación hacia atrás que empieza con el conjunto completo de predictores (o árbol completo) y elimina progresivamente predictores. El procedimiento de eliminación está basado en contrastes de independencia condicional usando el concepto de entropía. El procedimiento propuesto es comparado con CHAID.
The CHAID (Chi-Squared Automatic Interaction Detection) treebased segmentation technique has been found to be an effective approach for obtaining meaningful segments that are predictive of a K-category (nominal or ordinal) criterion variable. CHAID was designed to detect, in an automatic way, the nteraction between several categorical or ordinal predictors in explaining a categorical response, but, this may not be true when Simpson’s paradox is present. This is due to the fact that CHAID is a forward selection algorithm based on the marginal counts. In this paper we propose a backwards elimination algorithm that starts with the full set of predictors (or full tree) and eliminates predictors progressively. The elimination procedure is based on Conditional Independence contrasts using the concept of entropy. The proposed procedure is compared to CHAID.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados