2016-12-22 6 views
-2

Я довольно новичок в поисковых системах и довольно новичок в обучении машинам. Но я хотел знать, есть ли способ объединить функциональные возможности поисковых систем, таких как elasticsearch или Apache Solr, и проект машинного обучения, например Apache Mahout, H2O или PredictionIO.Комбинируйте поисковую систему и машинное обучение

Например, если вы работаете на веб-сайте путешествия, где вы можете найти пункт назначения. Вы начинаете тип «au», поэтому первые предложения - «AUstria», «AUstralia», «mAUrice island», «mAUritania» ... и т. Д. Это обычно то, что может сделать elasticsearch.

Но вы знаете, что этот пользователь уже трижды путешествовал по Мавритании, поэтому вы хотите, чтобы Мавритания вышла на первое место предложений. И я предполагаю, что это обычно то, что может сделать машинное обучение.

Есть ли мосты между этими двумя типами технологий? Может ли машинное обучение эффективно работать в поисковой системе?

Я открыт для всех ответов, независимо от используемых технологий. Если вы когда-либо испытывали такого рода проблем, мои уши широко открыты :-)

Спасибо

+3

Я думаю, что это интересная тема, которая будет закрыта как слишком широкая. Возможно, вы можете удалить его и попробовать новый вопрос, который фокусируется именно на проблеме, которую вы хотите решить. Например. как улучшить elasticsearch, если мы знаем контекстуальную информацию о пользователе? Или начните с технологии: как использовать H2O для разумного заказа поисковых предложений, возвращенных поисковой системой. –

ответ

1

Ваш вопрос очень общий, так мой природа-ответ должны быть одинаковыми.

Рассмотрите структуру рекомендаций, например, в Apache Mahout correlated co-occurance. В отличие от рекомендации по исправлению ванили, эта реализация позволяет выполнять несколько видов действий, например, просматривать веб-сайт, заказывать их раньше, демографическую информацию и т. Д.

Теперь вы будете вычислять рекомендации для каждого пользователя за любой промежуток времени. Рекомендации основаны на нескольких критериях и на том, что сделали другие люди, подобные этому пользователю. Подумайте, что ваши «предметы» в этом случае будут каждым пунктом назначения в мире. Таким образом, у нас теперь есть все возможные назначения для каждого пользователя.

Это тривиальное расширение для индексации упругого поиска пользователем/упорядоченным списком рекомендованных пользователями мест назначения.

Например, у нас есть пользователь, который посетил Берлин, посмотрел на несколько отелей в Вене и находится в Романии. Когда пользователь вводит «au», мы ожидаем увидеть, что «Австрия» оказалась в результатах намного выше, чем «Austrailia»

В комментариях и путях голосования вы, вероятно, должны были либо A) задать более конкретный вопрос программирования или B) задал этот вопрос на другом форуме, таком как Data Science Stack Exchange, fyi