Как реализовать пол (двойной) в AVX?

Функция C и C++ double floor(double arg) (определенная в cmath и math.h) возвращает наибольшее целое значение не более arg. Каков наиболее эффективный способ его векторизации с помощью инструкций AVX?Как реализовать пол (двойной) в AVX?

По сути, то, что я хочу

__m256d floor(__m256d arg);

Нужно ли преобразовать в целое и обратно?

источник

2016-02-29 Walter

Хотите поддерживать значения больше, чем 2^31? – anatolyg

Я не думаю, что вы даже можете безопасно преобразовать в целое число, потому что нет конвертированного двойного> 64-битного преобразования до AVX512, только скалярного CVTTSD2SI r64, xmm/m64'. Хорошо, что SSE4.1 'roundpd'. : P –

Это внутренняя существует как _mm256_floor_pd

источник

2016-02-29 09:20:52 Bahbar

Ooops. По какой-то причине он уклонился от моего поиска. – Walter

@Walter: это происходит со всеми нами :) Руководство по интригам, которое я связал, отлично подходит для поиска. – Bahbar

Как реализовать пол (двойной) в AVX?

ответ

Смежные вопросы