Aspects of GPU perfomance in algorithms with random memory access

Alexander V. Kashkovsky, Anton A. Shershnev, Pavel V. Vashchenkov

Результат исследования: Публикации в книгах, отчётах, сборниках, трудах конференцийстатья в сборнике материалов конференциинаучнаярецензирование

2 Цитирования (Scopus)

Аннотация

The numerical code for solving the Boltzmann equation on the hybrid computational cluster using the Direct Simulation Monte Carlo (DSMC) method showed that on Tesla K40 accelerators computational performance drops dramatically with increase of percentage of occupied GPU memory. Testing revealed that memory access time increases tens of times after certain critical percentage of memory is occupied. Moreover, it seems to be the common problem of all NVidia's GPUs arising from its architecture. Few modifications of the numerical algorithm were suggested to overcome this problem. One of them, based on the splitting the memory into "virtual" blocks, resulted in 2.5 times speed up.

Язык оригиналаанглийский
Название основной публикацииProceedings of the XXV Conference on High-Energy Processes in Condensed Matter, HEPCM 2017
Подзаголовок основной публикацииDedicated to the 60th Anniversary of the Khristianovich Institute of Theoretical and Applied Mechanics SB RAS
Редакторы Fomin
ИздательAmerican Institute of Physics Inc.
Число страниц8
Том1893
ISBN (электронное издание)9780735415782
DOI
СостояниеОпубликовано - 26 окт. 2017
Событие25th Conference on High-Energy Processes in Condensed Matter, HEPCM 2017 - Novosibirsk, Российская Федерация
Продолжительность: 5 июн. 20179 июн. 2017

Серия публикаций

НазваниеAIP Conference Proceedings
ИздательAMER INST PHYSICS
Том1893
ISSN (печатное издание)0094-243X

Конференция

Конференция25th Conference on High-Energy Processes in Condensed Matter, HEPCM 2017
Страна/TерриторияРоссийская Федерация
ГородNovosibirsk
Период05.06.201709.06.2017

Fingerprint

Подробные сведения о темах исследования «Aspects of GPU perfomance in algorithms with random memory access». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать