0

Я читаю «Архитектура компьютеров: количественный подход, 5-е изд.», И я смотрю пример из главы 5 на стр. 350. Прикрепленное изображение представляет собой проверку данного примера. Я не совсем понимаю логику того, как они действуют в этом примере.понимание задержек связи в параллизме

enter image description here

Мои вопросы следующим образом:

  1. Где время 0.3ns цикл приходит?
  2. 200/0.3 примерно 666 циклов, я следую за этим. Однако при подключении обратно к уравнению CPI это не имеет смысла: 0.2% (0.002) x 666 равно 1.332, а не 1.2. Что здесь происходит?
  3. Когда говорят, что «многопроцессор со всеми локальными ссылками равен 1,7/0,5 = 3,4 раза быстрее», откуда они получают это? Значение: я не вижу нигде в данной информации о том, что местная связь в два раза быстрее ...

Любая помощь будет принята с благодарностью.

+5

Это не вопрос программирования: речь идет об аппаратном дизайне и измерении производительности. Это было бы лучше опубликовано на [cs.se] –

ответ

3

Где находится время цикла 0.3ns?

Это происходит от тактовой частоты 3,3 ГГц. 1/3,3 ГГц = 0,3 нс.

200/0.3 примерно 666 циклов, я следую за этим. Однако при подключении обратно к уравнению CPI это не имеет смысла: 0.2% (0.002) x 666 равно 1.332, а не 1.2. Что здесь происходит?

Я думаю, что вы правы. Это похоже на опечатку. Это должно быть

CPI = 0,5 + 1,33 = 1,83

Когда они говорят, что «многопроцессорный со всеми местными ссылками 1,7/0,5 = 3,4 раза быстрее», где они получают, что с? Значение: Я не вижу нигде в данной информации о том, что местная связь в два раза быстрее ...

Они не говорят нигде, что локальное общение в два раза быстрее. Они делят эффективный ИПЦ, который они рассчитали для мультипроцессора, с 0,2% удаленных ссылок базовым ИПЦ 0,5. Это говорит вам, сколько раз быстрее, чем многопроцессор со всеми локальными ссылками. (Конечно, это должно быть около 1,83/0,5 = 3,66 раза быстрее.)