У меня есть разреженная матрица A, и я бы хотел (направлять) решение Ax = b. У меня около 500 векторов b, поэтому я бы хотел решить для соответствующих 500 x. Я новичок в CUDA, поэтому я немного смущен относительно того, какие варианты у меня есть.пакетное решение CUDA с разреженной лентой Ax = b для различных b's
cuSOLVER имеет пакетный прямой решатель cuSolverSP для разреженного A_i x_i = b_i, используя QR here. (С тобой все будет хорошо, так как А прилично обучен.) Однако, насколько я могу судить, я не могу использовать тот факт, что все мои A_i одинаковы.
Может ли альтернативный вариант сначала определить разреженную факторизацию LU (QR) на процессоре или графическом процессоре, а затем параллельно выполнять обратную подстановку (соответственно, backsub и matrix mult) на GPU? Если cusolverSp< t >csrlsvlu() для одного b_i, есть ли стандартный способ выполнить эту операцию для нескольких b_i?
Наконец, поскольку у меня нет интуиции для этого, следует ли ожидать ускорения на GPU для любого из этих вариантов, учитывая необходимые накладные расходы? x имеет длину ~ 10000-100000. Благодарю.