В чем основные отличия между поисковыми системами (DtSearch, Lucene.net, Sphinx, Google и т. Д.), Которые должны влиять на решение о том, как использовать для поиска запатентованных данных?В чем основные отличия между поисковыми системами, которые должны влиять на решение о том, как использовать для поиска запатентованных данных?
Данные, подлежащие поиску, состоят из данных без представления, которые помечены метаданными в виде пар имя/значение. Нам не интересны возможности синтаксического разбора формата различных инструментов. Кроме того, результаты поиска должны быть хорошо структурированными, без представления данных, которые могут быть объединены с результатами поиска из других (аналогично структурированных репозиториев).
Ниже перечислены некоторые соответствующие характеристики поисковой системы, которые должны сообщать о решении. предложения или описание опыта приветствуются.
• Стоимость • Простота использования • Может быть настроен для возврата определенных тегов только • Может ли «определить» специфические термины дают результаты поиска больший вес этих результатов • Быстро < 0.3seconds для возврата результатов поиска или% E6 записей/документов Поддержка тегов с типами (найти погоду = «солнечный», но не личность = солнечный) • Поддержка взвешиваний, чтобы дать уместность рейтинга • Возвращает результаты в порядке ранжирования по: релевантность • Поддержка синонимов • Поддержка однокоренные • Поддержка стоп-слова • Поддержка орфографические поправки • Поддается параллелизме или индекса здания (если индекс, основанный) • Быстрая переиндексации (если индекс) • Быстрое обновление индекса (если индекс) • Объединить результаты из нескольких индексов (если индекс) • Проверки близости: дайте большую актуальность словам, найденным близко друг к другу.