Я хочу добавить четыре компонента регистра SSE для получения одного поплавка. Вот как я это делаю сейчас:добавление компонентов регистра SSE
float a[4];
_mm_storeu_ps(a, foo128);
float x = a[0] + a[1] + a[2] + a[3];
Есть ли инструкция SSE, которая непосредственно достигает этого?
Я сомневаюсь, что он существует, но если это так, команда скорее всего поместит результат в 32-разрядную область 128-битного выходного регистра, а не в 32-битный регистр. –