Resumen de Extracción de conocimiento a partir de datos imprecisos. Aplicación al diagnóstico precoz de la dislexia.

Ayuda

Resumen de Extracción de conocimiento a partir de datos imprecisos. Aplicación al diagnóstico precoz de la dislexia.

Ana María Palacios Jiménez

En algunos problemas, y en especial en el tratamiento de la dislexia, la información proporcionada sobre los objetos, en este caso los test aplicados, incluyen incertidumbre, es decir, no tenemos un valor exacto del objeto observado sino que su percepción es imprecisa, lo que denominaremos datos de baja calidad. En el caso más simple, la información puede venir representada por un valor intervalar que proporciona los valores entre los cuales puede estar el valor real del objeto. En general, lo que obtendremos serán conjuntos de valores donde cada uno de ellos contendrá el valor real del objeto con una cierta probabilidad.

En la actualidad existen muchos problemas reales donde la información obtenida viene representada por conjuntos de datos imprecisos o de baja calidad. Para el tratamiento de dichos datos se puede optar por sustituir dicha imprecisión por un valor concreto y representativo. Sin embargo, se propone el tratamiento de dichos datos para comprobar, con problemas reales, que la presencia de esta imprecisión puede aportar buenos resultados finales. Para ello, el tratamiento de estos datos se basará en una representación posibilística. Es decir, dada una variable en estudio que no se puede percibir con precisión y de la que no se tendrá un conocimiento completo sobre su distribución de probabilidad, la representación posibilística asume que esta imprecisión vendrá representada por un conjunto borroso, el cual identificaremos con las familias de distribuciones de probabilidades y donde cada alfa-corte, de este conjunto borroso, tiene la probabilidad de contener el valor real del objeto, al menos, con un valor de uno menos el valor del alfa-corte.

La obtención de los datos imprecisos o de baja calidad aportados por el experto en el campo de la dislexia implica, como primer objetivo, un análisis exploratorio y exhaustivo de los niños que padecen y no padecen dislexia, así como, un estudio de los distintos test aplicados en las evaluaciones de dichos niños. A partir de dichos datos el objetivo será diseñar un sistema basado en reglas borrosas capaz de soportar datos de baja calidad que pueda ser utilizado por cualquier persona inexperta en el campo de la dislexia, sobre todo padres y profesores, para determinar si un niño es disléxico o no. Los datos aportados contienen imprecisión tanto en los test aplicados a los niños como en el diagnóstico aportado por el experto, esto implica una ampliación del campo en estudio debido a la obtención de datos imprecisos imbalanceados, donde el nivel de imbalanceado viene definido por un valor inexacto. A todo lo anterior se le suma la problemática de trabajar con una matriz de costes asimétrica definida mediante datos imprecisos a la hora de clasificara un niño y obtener el fitness de la función, es decir, con ello, clasificar mal a un niño tendrá distintos niveles de error definidos mediante valores intervalares o etiquetas lingüísticas. Además, en la recolección de los datos se observa la dependencia y relación entre diversos test. Por ello se ha de considerar, como otro objetivo más de la tesis, el análisis de dependencias entre datos de baja calidad centrándonos en la extracción de reglas de asociación difusas.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Mi Documat

Selección

Coordinado por: