1
Кто-нибудь знает, как поток кода распределяется по GPU в SLURM? Я прошел через и обнаружил, что переменная среды CUDA_VISIBLE_DEVICES не обновляется ни в каком коде. Итак, как это делается в коде?Кодовый поток slurm gpu allocation
Моя цель - добавить новую аппаратную поддержку, используя переменную среды для распределения.
Я видел gres_gpu.c файл, а также хранятся отпечатки в этом файле, но выполнение программы не доходят до здесь, даже если я просил GPU устройств. Но если я запустил команду «srun env», то она покажет, что CUDA_VISIBLE_DEVICES = 1. Поэтому я хочу посмотреть, где обновляется CUDA_VISIBLE_DEVICES. И еще одна вещь, в которой структуры данных содержат информацию о доступных процессорах и gpus и о том, сколько из них занято? – user21096