Resumen de Consumo energético de métodos iterativos para sistemas dispersos en procesadores gráficos

Ayuda

Resumen de Consumo energético de métodos iterativos para sistemas dispersos en procesadores gráficos

Joaquín Pérez Badenes

Hoy en día, en las aplicaciones científicas y de ingeniería surgen con mucha frecuencia problemas de resolución de sistemas de ecuaciones lineales dispersos de gran dimensión. El incesante crecimiento de los tamaños de estos problemas, entre otros factores, propicia un creciente incremento del consumo energético en los grandes centros de cálculo. Las restricciones energéticas imperantes, y la concienciación con el respeto al medio ambiente, propició la aparición de Green Computing, con el objetivo de diseñar aplicaciones conscientes de la energía y considerar la eficiencia energética (GFLOPS/W) como un parámetro prioritario. Tradicionalmente, se ha considerado que el rendimiento es directamente proporcional al consumo energético, pero la aplicación de estas nuevas técnicas permite incrementar el rendimiento que requieren las aplicaciones científicas con un consumo energético ajustado.

Los objetivos de esta Tesis Doctoral se enfocan hacia el estudio y desarrollo de técnicas de ahorro de energía en sistemas de cómputo heterogéneo, CPU-GPU, para diseñar aplicaciones que consigan minimizar el consumo energético sin sacrificar el rendimiento, en la resolución de sistemas lineales dispersos mediante métodos iterativos. Para ello se explota que las GPUs muestran un ahorro de energía muy significativo cuando se sincronizan con la CPU en modo blocking, aunque su rendimiento disminuye de forma considerable. Por el contrario, las GPUs alcanzan máximas prestaciones cuando están sincronizadas en modo polling, pero ello supone un sumidero de energía por parte de la CPU al permanecer en un estado activo. El diseño de “técnicas de fusionado de kernels CUDA”, propicia una reducción del número de kernels, eliminándose tiempos de lanzamiento de kernels, y tiempos de transferencia de información entre los espacios de memoria de la CPU y la GPU. Además, si la GPU está sincronizada en modo blocking, la reducción del número de kernels también decrementa el número de cambios de un estado de bajo consumo energético de la CPU hasta otro activo, eliminando los correspondientes tiempos de espera de recuperación de la CPU, que permite que el coste de ejecución del modo blocking sea muy parecido al del modo polling.

Debido a su complejidad, las “técnicas de fusionado de kernels CUDA”, sólo son utilizadas por programadores expertos, por lo que el diseño de una metodología ayudará de forma sistemática al proceso de “fusionado de kernels CUDA”. Esta tarea es la principal aportación de esta Tesis Doctoral, extendiendo su aplicación sobre arquitecturas de GPU que soporten paralelismo dinámico, que permite optimizar resolutores para que puedan ejecutarse de forma desacoplada de la CPU. Los resultados experimentales obtenidos validan mejoras destacables tanto en rendimiento como en eficiencia energética, obteniendo un compromiso entre rendimiento y consumo energético constante y equilibrado.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Mi Documat

Selección

Coordinado por: