Это не совсем ответ, но я чувствую себя так ограниченным полем комментариев ...
Я делаю много MPI-программирования, OpenMP тоже, но не CUDA и GPU. Я пишу в основном Fortran, некоторые C++. Я все еще использую Emacs в качестве моего редактора, а для других вещей, которые Emacs делает хорошо. Я использую отдельный параллельный отладчик (DDT, я использовал TotalView в прошлом, больше вопрос о том, какой из них находится на машине, чем тот, который я предпочитаю) и инструмент профилирования производительности под названием OPT (например, ДДТ, созданный Allinea Software).
Я смотрел, хотя и не на год или около того, на плагины для NetBeans и Eclipse (прежнее предпочтение, последнее слишком Java-ориентированное и слишком тяжелое в наши дни) для параллельного программирования. Что лучше для C++, чем для Fortran. Но я еще не сталкивался с каким-либо подключаемым модулем, который действительно сделал это достаточно далеко от исследовательской лаборатории, чтобы быть достаточно полезным, чтобы заставить меня перейти от старых способов.
Я буду заинтересован как вы, чтобы узнать, что другие SOers рекомендуют, хотя сейчас это выглядит не очень многообещающим.