2015-10-27 5 views
3

Я пытаюсь запустить этот код, и он говорит об ошибке сегментации при запуске. Он компилируется хорошо. Вот код. (Он отлично работает на окнах).Ошибка сегментации AVX на linux

#include<iostream> 
#include<vector> 
#include<immintrin.h> 

const int size = 1000000; 

std::vector<float>A(size); 
std::vector<float>B(size); 
std::vector<float>C(size); 

void bar(int i){ 
    const float a = 2.0f; 
    __m256 _a = _mm256_broadcast_ss(&a); 
    __m256 _A = _mm256_load_ps(&A[0] + i*8); 
    __m256 _B = _mm256_load_ps(&B[0] + i*8); 
    __m256 _C = _mm256_add_ps(_B, _mm256_mul_ps(_a,_A)); 
    _mm256_store_ps(&C[0] + i*8, _C); 
} 


int main(){ 
    std::fill(A.begin(), A.end(), 1.0f); 
    std::fill(B.begin(), B.end(), 2.0f); 
    bar(0); 

    return 0; 
} 

Компиляция: g++ -mavx t2.cpp -o t2

Это выход, когда он попал в первую команду AVX. Я просто хочу, чтобы кто-то просмотрел мой код.

Вот GDB назад след

(gdb) run 
Program received signal SIGSEGV, Segmentation fault. 
0x0000000000400aea in bar(int)() 
Missing separate debuginfos, use: debuginfo-install glibc-2.17-78.el7.x86_64 libgcc-4.8.3-9.el7.x86_64 libstdc++-4.8.3-9.el7.x86_64 
(gdb) bt 
#0 0x0000000000400aea in bar(int)() 
#1 0x0000000000400b95 in main() 
(gdb) 
+0

«Скомпилировать товар» не означает, что «это полезная программа». Вы должны объяснить, где этот код сбой. мы не собираемся пытаться УГАДАЕМ, где ошибка. –

+0

Конечно. Он сбой, когда он попадает в первую инструкцию AVX – Fr34K

+1

Для начала, похоже, что вы ссылаетесь на '& A [0] + i * 8', когда i не является вашей переменной цикла. Кроме того, я бы удостоверился, что 'loop' делится на 8 и делает' j + = 8' в качестве вашего приращения цикла и устанавливает ваш адрес в 'A [j]'. Кроме того, ваши векторы могут быть неправильно выровнены, вы должны убедиться, что A [0] выровнен по мере необходимости AVX. Большинство современных компиляторов действительно выравнивают память по соображениям производительности, но я не знаю, какие гарантии сделаны. Вот почему многие SSE/AVX-коды используют такие вещи, как '_aligned_malloc' – RyanP

ответ

4

Это, вероятно, проблема выравнивания данных. Для _mm256_load_ps требуется 256-битная (32-байтная) выровненная память. Распределитель по умолчанию для std :: vector не отвечает этому требованию. Вам нужно будет предоставить выровненный распределитель или использовать другую команду с менее строгим требованием выравнивания (например, _mm256_loadu_ps).

+0

Спасибо, что это сработало! Спасибо @RyanP за альтернативный ответ! :) – Fr34K