2016-11-24 7 views
2

У меня есть строка seule la présentation.Sphinx - Breaks utf8 символ в космос

Когда я делаю фразы поиск «пр», сфинкс соответствует этой строке, но она не должна, поскольку нет ни слова пра присутствует в нем.

Но при поиске "pre", он не подходит.

Проблема, кажется, с этим символом utf8 é. Sphinx игнорирует этот символ при индексировании и обрабатывает строку перед этим символом в виде слова.

Вот пример запроса Sphinx с режимом матча SPH_MATCH_EXTENDED:

@name: "pr" 

Есть ли какой-либо обходной путь для этого?

ответ

1

не эксперт по этому вопросу, но знает, с сфинкса вы должны явно перечислить то, что charactors считаются частью «словами» (все остальное считается сепаратором обеспечивает), через charset_table

http://sphinxsearch.com/docs/current/conf-charset-table.html

Таким образом, вы бы необходимо включить эти Charactor (ы) в charset_table для них индексироваться (с или без «складывания» к не-диалектных символов)

Это вики страница http://sphinxsearch.com/wiki/doku.php?id=charset_tables , в котором перечислены S ome, вы можете копировать/вставлять.

+0

Спасибо, Барри! Добавление 'charset_table' сработало для меня. – Samir

 Смежные вопросы

  • Нет связанных вопросов^_^