2013-04-08 6 views
1

Я работаю над реализацией алгоритма LexRank (link) для проекта.Алгоритм суммирования LexRank

То, что я не понял об алгоритме, - это создание конечной матрицы, где вычисленные значения tf-idf (после факторизации их престижа). Как создать сводку? Я просто беру предложения top-k? Удалить одно предложение, добавить его в резюме и снова запустить процесс без него? или что-то другое?

ответ

1

Из Википедии для Automatic Summarisation

В обеих алгоритмах [LexRank & TextRank], предложения оцениваются с применением PageRank к полученному графику. Сводка формируется путем объединения предложений верхнего рейтинга с использованием ограничения порога или длины для ограничения размера сводки.