2014-01-02 5 views
1

Я горнодобывающие Litecoins с использованием AMD Radeon HD7850 с 2G глобальной памяти, и мой конф ниже:Почему `lookup_gap = 2` быстрее, чем` lookup_gap = 1`, когда память достаточно

thread-concurrency=4096 
lookup-gap=2 

После прочитав алгоритмы scrypt130511.cl, я обнаружил, что поиск-зазор используется для компиляции временной памяти.

Он потребляет 512 глобальной памяти, когда loopup-щель 2, в то время как он потребляет 1 Гб глобальной памяти, когда loopup-зазор 1.

Но после того, как я изменить подстановок запрещенную к 1, hashrate упал с 320K до 300K , Почему он медленнее, когда меньше вычислений?

ответ

2

Это, главным образом, фактор компромисса для процессора и памяти. Поэтому у вас есть несколько факторов, которые следует учитывать. Взаимодействие lookupgap с блокнотом, который фиксируется на 128 Кбайт на хэш (для добычи Litecoin). Таким образом, ваш GPU имеет небольшую локальную память для каждого ядра, имеющего ОЧЕНЬ высокую пропускную способность и большую глобальную память. (Подробнее о арке памяти графического процессора вы можете узнать здесь: http://www.microway.com/hpc-tech-tips/gpu-memory-types-performance-comparison/)

Итак, операции с блокнотом очень велики, если у вас лучшая пропускная способность, у вас будет больше скорости. Так что, возможно, что происходит, что блокнот не подходит для вашей локальной памяти, но когда вы устанавливаете lookup-gap = 2, вы получаете половину размера, поэтому подходит больше в локальной памяти, чем раньше, поэтому GPU могут сделать эти операции локальными.

У другой точки, общая память возникает проблема при использовании всех ядер вашего GPU: они не могут выполнять операции чтения и записи в памяти одновременно. А для локальной памяти каждый процессор графического процессора имеет свои собственные, поэтому все они могут выполнять массивные операции чтения/записи с нуля.

Это фактор, который может привести к его снижению, но не обязательно это. Существует множество факторов, которые могут изменить ваш уровень хэширования. Надеюсь, это поможет: D

0

Возможно, потому что есть другие факторы, такие как время доступа к памяти и ширина полосы памяти?

 Смежные вопросы

  • Нет связанных вопросов^_^