Я читаю «Архитектура компьютеров: количественный подход, 5-е изд.», И я смотрю пример из главы 5 на стр. 350. Прикрепленное изображение представляет собой проверку данного примера. Я не совсем понимаю логику того, как они действуют в этом примере.понимание задержек связи в параллизме
Мои вопросы следующим образом:
- Где время 0.3ns цикл приходит?
- 200/0.3 примерно 666 циклов, я следую за этим. Однако при подключении обратно к уравнению CPI это не имеет смысла: 0.2% (0.002) x 666 равно 1.332, а не 1.2. Что здесь происходит?
- Когда говорят, что «многопроцессор со всеми локальными ссылками равен 1,7/0,5 = 3,4 раза быстрее», откуда они получают это? Значение: я не вижу нигде в данной информации о том, что местная связь в два раза быстрее ...
Любая помощь будет принята с благодарностью.
Это не вопрос программирования: речь идет об аппаратном дизайне и измерении производительности. Это было бы лучше опубликовано на [cs.se] –