Я нашел lib но неCalc atan2 неоном
void atan2fv_neon_hfp(float *y, float *x,float *res,int len)
для расчета Len плавает один раз.
Как написать неоновую версию для atan2fv_neon_hfp
?
Я нашел lib но неCalc atan2 неоном
void atan2fv_neon_hfp(float *y, float *x,float *res,int len)
для расчета Len плавает один раз.
Как написать неоновую версию для atan2fv_neon_hfp
?
Оглядываясь на реализацию atan2f_neon_hfp, похоже, что нет ничего, что было бы невозможно для тривиального векторизации (путем загрузки пар в d16 и d17 вместо vdup'ing в них), но вам понадобится знать сборку ARM/NEON. Кроме того, вы можете просто вызвать скалярную версию в цикле.
как math-neon, atan2f_neon_hfp на самом деле не очень быстро для нескольких поплавков, я хочу найти способ расчета 4х-поплавков каждый раз, когда вы используете neon.I я новичок в неоне. Поэтому я хочу найти пример, чтобы узнать больше навыков в неоне. скалярная версия в цикле не может решить мою проблему. Это все еще медленно для нескольких поплавков. – WateLemon
Примечание [точность ** NEON **] (http://stackoverflow.com/questions/7346521/subnormal-ieee-754-floating-point-numbers-support-on-ios-arm-devices-iphone -4) не совпадает с стандартными библиотеками. –