Воспользуйтесь приведенной ниже ссылкой в качестве примера: http://www.yelp.com/biz/chef-yu-new-york.Как Yelp создает раздел «Обзорные моменты»?
В разделе «Основные моменты обзора» есть 3 фразы (пряный кубик, счастливый час, специальные предложения), которые подсвечиваются на основе отзывов, представленных пользователями. Очевидно, что это фразы, которые появлялись чаще всего, или самые длинные фразы, которые часто появлялись или какая-то другая логика.
Их официальное объяснение заключается в следующем:
В своих обзорах, Yelpers упомянул связанные фразы ниже много. И это не какие-то старые общие фразы, они также являются тем, что наши роботы Yelp определили уникальные и хорошие, быстрые способы для описать этот бизнес. Нажмите любую из фраз, чтобы увидеть все обзоры , которые упоминают об этом.
Мой вопрос в том, что они использовали для ввода текста для получения этих данных? Это какой-то алгоритм, основанный на Lempel Ziv, или какой-то вид карты? Я не был майором CS, поэтому, наверное, я здесь что-то теряю. Хотели бы получить помощь, теории и т. Д.
Спасибо!
Это, что «перфорационных все фразы» что мне интересно. Я думал, что, поскольку фразы имеют разную длину и сложность, возможно, они использовали некоторые вариации LZ для создания словаря, а затем выводят 3 самых длинных или самых используемых фраз. Возможно, они достигают этого по-другому. Любые идеи о том, что они могут использовать? Инструмент, технология или алгоритм? – Nuby