Мы противостоим различные поисковые машины для нашего исследования архивы и, просматривали Xapian-Omega документацию, мы решили попробовать его, так как вариант Омега, как представляется, подходящее решение с несколькими интересными параметрами поиска.Поиск с использованием Xapian Omega - с дикими картами или регулярных выражений
Мы установили Xapian-Omega на Linux Server (Deb 7) и успешно прошли тестирование с успехом. Однако мы не уверены в том, как можно использовать или использовать даже Wild Cards или Regular Выражения с Xapian-Omega.
Мы читаем, что для Xapian необходимо включить опцию Wild Card «Флаги QueryParser» Может ли кто-нибудь прояснить это? т.е. объясните или укажите страницу с примером или двумя.
Но мы не видели много информации о примерах с Omega CGI и, хотя этот последний работает хорошо, варианты диких карт (например, * для общего джокера и? Как один символ), не кажется, работают как ожидалось по умолчанию, и они будут полезными, хотя стебли и подстроки и т. д. могут быть функциональными.
Например: Было бы интересно, чтобы иметь возможность использовать стандартные простые дикие поиски полукокса с определенной точностью, такие как: медик * для медицины медицинского лекарственного или с? для одиночных символов
Может ли Regexp распознаваться с помощью Omega? например: sep [ae] r [ae] te (\ w +)? или поиске структурированных форматов, таких как электронная почта или кредитные карточки чисел или определенных типов формул в научно-исследовательских работах и т.д.
В записке от Олли Беттс давно (Dev Список рассылки) относительно этого одно предложение было Grep индекс файл, но это будет победить преимущество RAD Omega.
Есть примеры поиска с использованием Omega с дикими картами или регулярными выражениями бы оценивать ... даже указание на странице, где информация по этой теме хорошо представлена с примерами, иллюстрирующими, как разработать расширенный поиск используя Ксапиан был бы очень рад (возможно, PHP или Python).
(Мы не касается на данный момент о возможном существенного увеличения размера размера индекса или в время для индексирования архива)