2008-11-10 4 views
2

В чем основные отличия между поисковыми системами (DtSearch, Lucene.net, Sphinx, Google и т. Д.), Которые должны влиять на решение о том, как использовать для поиска запатентованных данных?В чем основные отличия между поисковыми системами, которые должны влиять на решение о том, как использовать для поиска запатентованных данных?

Данные, подлежащие поиску, состоят из данных без представления, которые помечены метаданными в виде пар имя/значение. Нам не интересны возможности синтаксического разбора формата различных инструментов. Кроме того, результаты поиска должны быть хорошо структурированными, без представления данных, которые могут быть объединены с результатами поиска из других (аналогично структурированных репозиториев).

Ниже перечислены некоторые соответствующие характеристики поисковой системы, которые должны сообщать о решении. предложения или описание опыта приветствуются.

• Стоимость • Простота использования • Может быть настроен для возврата определенных тегов только • Может ли «определить» специфические термины дают результаты поиска больший вес этих результатов • Быстро < 0.3seconds для возврата результатов поиска или% E6 записей/документов Поддержка тегов с типами (найти погоду = «солнечный», но не личность = солнечный) • Поддержка взвешиваний, чтобы дать уместность рейтинга • Возвращает результаты в порядке ранжирования по: релевантность • Поддержка синонимов • Поддержка однокоренные • Поддержка стоп-слова • Поддержка орфографические поправки • Поддается параллелизме или индекса здания (если индекс, основанный) • Быстрая переиндексации (если индекс) • Быстрое обновление индекса (если индекс) • Объединить результаты из нескольких индексов (если индекс) • Проверки близости: дайте большую актуальность словам, найденным близко друг к другу.

ответ

1

Что касается релевантности, Google Search Appliance позволяет немного настроить. Они считают, что предоставление слишком большой настройки даст плохую релевантность, и я считаю, что Google знает релевантность.

Маловероятно, что пользователи найдут поисковую систему, отличную от Google, более простой в использовании.

2

Мне нравится Solr с DataImportHandler. Он поддерживает большинство ваших маркеров и не слишком сложно настроить, если вы не возражаете редактировать некоторые файлы конфигурации XML. Это проще, чем многие поисковые системы корпоративного класса.

Нет ничего плохого в GSA (Google Search Appliance), но для контроля над тем, что вы желаете, Solr - лучший вариант.

Lucene/Solr

 Смежные вопросы

  • Нет связанных вопросов^_^