Я использую intel VTune для профилирования моей программы.Где целое число слияния и вычитания из intel Vtune?
Процессор, который я использую, - это мост IVY.
Все события инструкция аппаратных средств можно найти здесь:
https://software.intel.com/en-us/node/589933
FP_COMP_OPS_EXE.X87 Количество FP Вычислительной Uops Выполненная этот цикл. Число FADD, FSUB, FCOM, FMUL, целочисленные MUL и IMUL, FDIVs, FPREM, FSQRTS, целые DIV и IDIV. Это событие не отличить Fadd, используемую в середине трансцендентального течения от с
FP_COMP_OPS_EXE.X87, кажется, включает целочисленное умножение и целочисленное деление; однако там нет суммирования целых чисел и целочисленного вычитания. Я не могу найти эти два вида инструкций либо с вышеуказанного веб-сайта.
Может ли кто-нибудь сказать мне, что такое событие, которое учитывает инструкции сложения целых чисел и целых чисел?
Для них нет отдельного счетчика. Если вы хотите динамическое количество инструкций 'add' /' sub' и не менее дешевых, таких как 'cmp',' and', 'xor', посмотрите на [binary instrumentation] (http://stackoverflow.com/ вопросы/36650210/как к профилю-заместитель чИСЛО-дополнения-mutltiplications-и т.д.-с-VTune/36658984 # 36658984). 'add' является одной из самых дешевых двухпозиционных инструкций для любого обычного процессора. На IvB работает на любом порту ALU: 1 с задержка, по одной на 0,333с пропускную способность. Только «mov reg, reg» или команда обнуления дешевле. См. [X86 tag wiki] (http://stackoverflow.com/tags/x86/info). –