GPU – High Performance Computing Applications for Science and Engineering

ANALISIS DE APLICACIONES EN PLATAFORMAS GPU

Las GPUs actuales, entendidas como plataformas computacionales de bajo coste, proporcionan una excelente combinación de rendimiento con gran eficiencia energética. Ofrecen de forma compacta el acceso a miles de núcleos computacionales y un throughput de memoria muy alto. Desafortunadamente, hay que pagar el precio de una latencia elevada. A partir de aquí, estas plataformas se están usando para ejecutar aplicaciones científicas clasificadas como Big Data para acelerar la ejecución de algoritmos computacionalmente intensivos. En particular, las GPUs son un entorno ideal para resolver muchos problemas donde cada uno de los miles de threads en ejecución colaboran para resolver independientemente una parte del problema. Nuestro objetivo es buscar diseños donde podamos exponer un alto nivel de paralelismo de threads y de acceso a memoria para así ocultar las latencias de computación y de acceso a memoria. A partir de aquí, nuestra misión es mostrar el importante potencial que tienen las implementaciones eficientes sobre diversas plataformas GPU por parte de las aplicaciones científicas. Nuestros trabajos muestran nuevas estrategias de gestión de los recursos computacionales para mejorar el diseño y la implementación de las aplicaciones estudiadas.

Trabajos realizados:

Optimización de algoritmos de análisis de secuencias genómicas en aplicaciones bioinformáticas sobre entornos multi-core y GPU.

n-step FM-Index for Faster Pattern Matching. Procedia Computer Science, vol. 18, pp. 70-79, (ICCS 2013). Alejandro Chacón, Juan Carlos Moure, Antonio Espinosa, Porfidio Hernández.

Thread-Cooperative, bit-parallel computation of Levenshtein distance on GPU. Proceedings of the 28th ACM International Conference on Supercomputing, pp. 103-112. (ICS 2014) Alejandro Chacón, Juan Carlos Moure, Antonio Espinosa, Santiago Sola, Paolo Ribeca

FM-Index on GPU: a collaborative scheme to reduce memory footprint. IEEE International Symposium on Parallel and Distributed Processing with Applications (ISPA 2014), pp. 1-9. 2014. Alejandro Chacon, S. M. Sola, A. Espinosa, P. Ribeca, J.C. Moure

Boosting the FM-index on the GPU: effective techniques to mitigate random memory access. IEEE/ACM Transactions on Computational Biology and Bioinformatics. Vol.12 , num. 5. pp.1048-1059. 2015. A. Chacon, S. M. Sola, A. Espinosa, P. Ribeca, J.C. Moure

GEM3: CPU-GPU Heterogeneous DNA Sequence Alignment for Scalable Read Sizes. Alejandro Chacon. GPU Technology Conference 2016. San Jose. California.

Algoritmos de detección de peatones para la conducción autónoma en GPU.

DDFA Embedded real-time stereo estimation via Semi-Global Matching on the GPU. International Conference on Computational Science. ICCS 2016. D. Hernandez-Juarez, A. Chacon, A. Espinosa, D. Vazquez, J. C. Moure, and A. M. Lopez.

GPU-based pedestrian detection for autonomous driving. International Conference on Computational Science. ICCS 2016. V. Campmany, S. Silva, A. Espinosa, J.C. Moure, D. Vazquez, and A. M. Lopez

GPU-Based Pedestrian Detection for Autonomous Driving. GPU Technology Conference 2016. San Jose, California. Seleccionado como candidato para el Best Poster Award. V. Campmany, S. Silva, A. Espinosa, J.C. Moure, D. Vazquez, and A. M. Lopez

Real-time 3D Reconstruction for Autonomous Driving through Semi-Global Matching. GPU Technology Conference 2016. San Jose, California. D. Hernandez-Juarez, A. Chacon, A. Espinosa, D. Vazquez, J. C. Moure, and A. M. Lopez.

GPU-accelerated real-time stixel computation. IEEE Winter Conference on Applications of Computer Vision 2017. Santa Rosa, California. D. Hernandez-Juarez, A. Espinosa, D. Vazquez, A. M. Lopez, J. C. Moure.

Optimización del rendimiento de algoritmos de optimización combinacional

Coalition Structure Generation Problems: optimization and parallelization of the IDP algorithm. 6th International workshop on Optimization in Multi-agent systems. F. Cruz, JC Moure, A Espinosa, J Cerquides, JA Rodriguez, S. Ramchurn.

Paving the way for large-scale combinatorial auctions. Aamas 2015. International Conference on Autonomous Agents and Multiagents Systems. 120. F. Cruz, JC Moure, A Espinosa, J Cerquides, JA Rodriguez.

Parallelisation and application of AD3 as a method for solving large scale combinatorial auctions. 10th international Federated Conference on Distributed Computing Techniques. DisCoTec 2015. F. Cruz, JC Moure, A Espinosa, J Cerquides, JA Rodriguez.

Optimización del rendimiento de algoritmos de Discrete Wavelet Transform en entornos GPU.

Implementation of the DWT in a GPU through a Register-based Strategy. IEEE Transactions on Parallel and Distributed Systems, vol. 26, pp. 3394-3406. 2014. Pablo Enfedaque, Francesc Auli-Llinas, and Juan C. Moure.

Strategy of microscopic parallelism for bitplane image coding. Data Compression Conference (DCC 2015). F Auli-Llinas, P Enfedaque, JC Moure, I Blanes, V Sanchez.

Strategies of SIMD Computing for Image Coding in GPU. IEEE 2nd International Conference on High Performance Computing (HiPC 2015). Pablo Enfedaque, Francesc Auli-Llinas, and Juan C. Moure.

Bitplane Image Coding with parallel coefficient processing. IEEE Transactions on Image Processing, vol. 25, pp. 209-219. 2016. Pablo Enfedaque, Francesc Auli-Llinas, and Juan C. Moure.

Beyond Standards: A New GPU-Aware Image Coding System. Pablo Enfedaque. GPU Technology Conference 2016. San Jose, California

Planificación y gestión de recursos en la ejecución de workflows científicos en entornos híbridos GPGPU

Improving the Execution Performance of FreeSurfer. Neuroinformatics. Vol. 12(3). pp. 413-421. 2014. J Delgado, Juan C Moure, Y Vives-Gilabert, M Delfino, A Espinosa, B Gómez-Ansón

Planificación y gestión de recursos en la ejecución de workflows científicos en entornos híbridos GPGPU. Tesis doctoral. 2015.

Diseño, implementación y optimización de la correlación cruzada en aplicaciones de Sistemas de Navegación por Satélite.

GNSS-R Cross Correlation: Diseño, implementación y optimización de la correlación cruzada. Carlos Calvin. Proyecto Fin de Grado 2014.

Paralelización del Problema de Satisfacción de Restricciones Utilizando Arco-Consistencia

Paralelizacion del problema de satisfacción de restricciones utilizando arco-consistencia. Jordi Alcaraz. Proyecto Fin de Grado 2015. Premio al mejor proyecto en Ingeniería Informática.

Somos un Centro de Investigacion NVIDIA GPU. Gracias a Nvidia por su apoyo.