2010-02-04 4 views
1

Я был тяжелым пользователем в Сфинксе и Луцене. Sphinx просто берет базу данных, индексирует ее. И вы вызываете Сфинкса, чтобы получить идентификаторы.Как создать поисковую систему «на лету»? (с рейтингом/релевантностью)

Но что, если я хочу создать поисковую систему, это очень tiny. Всего несколько строк данных и несколько абзацев слов? Фокус в том, что строки данных постоянно меняются. Итак, у меня не может быть «индекса».

Я хочу, чтобы иметь возможность оценивать по релевантности, точно так же, как Sphinx. Как я могу это сделать? Конечно, я бы не пройти через индексацию ...

+0

Почему «постоянно меняющееся» означает «не может иметь« индекс »?» Каждая вставка и обновление базы данных также будут поддерживать индекс как текущий, так и текущий. Как вы можете избежать «индекса»? Пожалуйста, объясните, что препятствует индексированию? –

ответ

1

Если у вас есть только несколько строк данных и несколько абзацев слов в каждом, сохраните все это в памяти и используйте любой текстовый алгоритм, который имеет наибольший смысл для вашего контента.

0

Конечно, я бы не пройти через индексацию ...

Как вы собираетесь определить уместность не глядя на все?

Если есть только крошечный бит данных, и он настолько меняется, что сохранение индекса нецелесообразно, вы можете вместо этого генерировать индекс, когда хотите искать данные, запрашивать его, а затем отбрасывать индекс следующим время изменения данных. С небольшим набором данных, частыми обновлениями и нечастыми поисками это может быть более эффективным, чем поддержание индекса.

 Смежные вопросы

  • Нет связанных вопросов^_^