Я пытаюсь запустить реализованную реализацию галоида FFT here для сравнения с FTTW. Я могу запустить реализацию как есть, но я столкнулся с некоторыми проблемами при копании немного глубже. Подпрограмма выходит из строя с ошибками для разных значений H и W (высота и ширина случайного входного изображения). Например, я получаю следующее сообщение об ошибке с H = W = 5:Ошибки реализации Halide FFT?
Error at ./fft.cpp:603: Cannot vectorize dimension n0 of function v_S1_R5$6 because the function is scheduled inline. Aborted (core dumped)
Я пытаюсь проверить на небольших размерах изображения (т.е. 5х5), чтобы сравнить результаты алгоритмов, но я могу 'получить алгоритм для завершения для любых значений менее 16, что даже в этой точке делает проверку значений длинной задачей. БПФ также терпит неудачу при значениях, превышающих 32, по-видимому, не работает для всех недействительных 2.
Неужели кто-нибудь сталкивался с этим вопросом раньше? Существуют ли какие-либо другие реализации БПФ в галогенидах, которые работают для изображений разного размера?
Для справки, я запускаю код на RHEL7 с использованием gcc 4.8.3.