У меня проблемы с поиском слов, содержащих символы с акцентом. Я использую Sphinx 2.1.1, Linux, MsSQL 2005 через odbc (freetds).Акцентированные символы не индексируются в Sphinx
Вот мой sphinx.conf:
source parentSource
{
type = odbc
...
}
index parentIndex
{
morphology = stem_en
charset_type = utf-8
charset_table = 0..9, a..z, A..Z->a..z, ... (mapping taken from
http://sphinxsearch.com/wiki/doku.php?id=charset_tables for common, A-Z)
...
}
После изменения конфигурации, я переиндексирован все индексы и перезапустить Searchd. Когда я ищу «Muller» - получаю результаты, содержащие только «Muller». Когда я ищу «Мюллер» - я получаю только результаты «Мюллера». Но есть также записи «Müller» в db, , которые не индексируются должным образом. Отображение для ü (U + 00FC-> u), представленное в config. Я имею в виду после Я добавил символы с акцентом в charset_table, он (акцентированные символы) преобразуется при поиске, но не при индексировании содержимого, как я понимаю.
Когда я запускаю индекс с опцией --buildstops, я нашел следующую запись в выходном файле: «mller». И да, когда я ищу «mller» - я получаю результаты «Мюллера» (но нет «Мюллера», конечно).
Что мне нужно сделать для поиска по "Muller/Müller"? Давайте результаты для обоих "Muller" и "Müller"?
PS: сопоставление, используемое для столбца (и для базы данных wohle), является SQL_LATIN1_GENERAL_CP1_CI_AS. I изменить тип столбца с varchar на nvarchar, но это не помогает. «Müller» записывает правильно перемещен на сайте (без?), А когда я запускаю индексатор с --dump-строками.
К сожалению, это не помогло – c1tru55
Является ли это документированным где угодно? – fccoelho