Моя программа имеет два ядра, а второе ядро должно использовать уже загруженные входные данные и результаты из первого ядра, поэтому я могу сохранить передачи памяти. Как мне это сделать?Как сообщить PyCUDA повторно использовать память из более раннего ядра?
Это, как я запускаю мои ядра:
result = gpuarray.zeros(points, dtype=np.float32)
kernel(
driver.In(dataT),result,np.int32(points),
grid = (blocks,1),
block = (block_size, 1, 1),
)