2016-03-15 5 views
1

Так что я немного запутался в реализации GraphX ​​pagerank.GraphX ​​Pagerank Реализация

https://github.com/apache/spark/blob/feaa07802203b79f454454445c0a12a2784ccfeb/graphx/src/main/scala/org/apache/spark/graphx/lib/PageRank.scala#L115-L160

В частности, строка # 138, https://github.com/apache/spark/blob/feaa07802203b79f454454445c0a12a2784ccfeb/graphx/src/main/scala/org/apache/spark/graphx/lib/PageRank.scala#L138.

Почему не ранг страницы для вершины определяется как resetProb + (1.0 - resetProb) * msgSum вместо oldPR + (1.0 - resetProb) * msgSum

Может кто-нибудь объяснить эту разницу? Ссылки также не указывают на мастер, извините, если кто-то смущен этим, однако мастер все еще имеет тот же код.

ответ

0

Какой смысл делать это?

resetProb + (1.0 - resetProb) * msgSum 

resetProb не изменяется при выполнении алгоритма (по умолчанию он равен 0,15). Так что это просто константа. Почему, по вашему мнению, имеет смысл добавить постоянный уровень страницы каждой вершины.

 Смежные вопросы

  • Нет связанных вопросов^_^