2015-06-04 4 views

ответ

1

Исходный алгоритм ранжирования страницы не позволяет использовать автоматические петли. Однако есть некоторые варианты, которые либо явно добавляют self-loops, либо рассматривают те, которые присутствуют в структуре ссылок.

Итак, у нас есть полный веб-сайт (или веб-сайт, который мы сканировали), содержащий только два узла. A имеет собственный цикл, а другая ссылка на B. B не имеет ссылок. Это приводит к 0 значениям в конечном PR-векторе. В книге MMDS (Ullman) предлагается несколько вариантов: (1) Результирующее значение Dead Dead End или (2) Добавить параметры налогообложения. enter image description here В вашем примере мы можем удалить второй узел. См. Рис. Ii. Теперь мы остаемся с одним узлом с self-контуром. Помните, что удаленный узел еще не получил 0 очков. Если, скажем, ваша реализация предполагает, что само-цикл будет считаться inlink, теперь A имеет показатель PR 1. B имеет один преемник (A), который будет способствовать этому. A имеет две исходящие линии (ваше предположение о петле, плюс ссылка на B). См. Рис. Iii. Итак, наконец, мы получаем PR в качестве 0

Обратите внимание, что суммы PageRank превышают 1, и они больше не представляют распределение случайного серфера. Тем не менее, они представляют собой достойные оценки относительной важности страниц. * Ullman MMDS, стр. 172-173, стр. 9-10 в формате pdf.

Книга Ссылка: http://infolab.stanford.edu/~ullman/mmds/ch5.pdf

+0

WOW спасибо большое! Иллюстрации и объяснения очень ясны :) – hope288