У меня есть вопросы, когда я пытаюсь реализовать PageRank с mapreduce. Я хочу привести здесь коды https://stackoverflow.com/a/5029780/1117436, чтобы описать проблему.как итерации при вычислении pagerank с mapreduce
map ((url,PR), out_links) //PR = random at start
for link in out_links
emit(link, ((PR/size(out_links)), url))
reduce(url, List[(weight, url)):
PR =0
for v in weights
PR = PR + v
Set urls = all urls from list
emit((url, PR), urls)
В описанном выше способе, это ясно, что второй параметр ввода процедуры отображения является Out ссылки на URL, но второй параметр выхода уменьшить процедуру, как представляется, что в звеньях URL. Итак, как эти коды работают итеративно?
Тогда я хочу спросить, как написать коды, чтобы заставить pagerank alrorithm работать правильно?
ОБНОВЛЕНИЕ: Я думаю, что этот ответ решает мою проблему. https://stackoverflow.com/a/13568286/1117436
спасибо, но я просто хочу знать, как сделать вывод сокращения и ввода карты согласованными друг с другом в алгоритме pagerank. –