2013-09-18 5 views
0

Я нашел lib но неCalc atan2 неоном

void atan2fv_neon_hfp(float *y, float *x,float *res,int len) 

для расчета Len плавает один раз.

Как написать неоновую версию для atan2fv_neon_hfp?

+0

Примечание [точность ** NEON **] (http://stackoverflow.com/questions/7346521/subnormal-ieee-754-floating-point-numbers-support-on-ios-arm-devices-iphone -4) не совпадает с стандартными библиотеками. –

ответ

0

Оглядываясь на реализацию atan2f_neon_hfp, похоже, что нет ничего, что было бы невозможно для тривиального векторизации (путем загрузки пар в d16 и d17 вместо vdup'ing в них), но вам понадобится знать сборку ARM/NEON. Кроме того, вы можете просто вызвать скалярную версию в цикле.

+0

как math-neon, atan2f_neon_hfp на самом деле не очень быстро для нескольких поплавков, я хочу найти способ расчета 4х-поплавков каждый раз, когда вы используете neon.I я новичок в неоне. Поэтому я хочу найти пример, чтобы узнать больше навыков в неоне. скалярная версия в цикле не может решить мою проблему. Это все еще медленно для нескольких поплавков. – WateLemon