Я не могу легко управлять RSS-каналами из-за огромного количества новых рассказов/похожих новостей, размещенных на различных новостных сайтах. Для таких предметов, как мировые новости и деловые новости, многие из историй излишни, что добавляет бремя для читателей, чтобы разобраться, какие истории они уже прочитали. Чтобы справиться с двумя проблемами затопления и избыточности, мне нужно разработать код, который уменьшает количество элементов для чтения и использует перекрывающуюся информацию для божественных интересных тем.Группировка похожих новостей вместе, как в новостях GOOGLE
было бы легче, если бы я мог группировать похожие новости вместе, как в GOOGLE NEWS/StackOverflow, и представлять их пользователям.
* Категории тем * (спорт, мир, развлечения, здоровье ...) * предопределенные *? Другими словами, вы уже сейчас можете сгруппировать новости? (Если да, это контролируемая проблема обучения). Или это зависит от пользователя (ов), чтобы указать, сколько и какие категории тем существуют? (=> unsupervised => сложнее) – knb