Мне дается набор веб-страниц, и мне нужно создать рекомендацию для страницы. В зависимости от того, какой URL-адрес предоставляется приложению, приложение должно иметь возможность обнаруживать страницы из данного пула, похожие на страницу по URL-адресу.Из пула веб-страниц, поиск страниц, похожих на любую данную веб-страницу
Я попытался найти различные подходы к этому. Меня заинтересовало использование слова2vec. Я планирую просканировать весь заданный набор веб-страниц и генерировать теги для этой страницы на основе содержимого на этой странице. Из этих тегов я надеялся использовать word2vec для вычисления векторного значения для страницы и сохранения его. При поиске я мог бы сгладить вектор для данной страницы аналогичным образом, чтобы искать похожие значения. Это правильный способ использования word2vec? Какой учебный вектор следует использовать? Любой другой лучший способ выполнить эту задачу? Или просто обычное сопоставление текста было бы лучшим вариантом?