Может ли кто-нибудь сказать мне, что именно означает слово «шум» в службах индексирования? Я работаю над службами индексирования серверов Windows и получаю много проблем. Some questions on it: Does indexing services not search for noise words? What is the location and name of noise word file on windows server?
Спасибо.«Шумное слово» в службах индексирования
ответ
Они являются такими же, как стоп-слова:
https://en.wikipedia.org/wiki/Stop-words
В вычислительной технике, стоп-слова есть слова, которые отфильтрованы до, или после, обработки данных на естественном языке (текст). Существует не один определенный список стоп-слов, которые используются всеми инструментами, и такой фильтр не всегда используется. Некоторые инструменты специально избегают их удаления для поддержки поиска фразы.
Смотрите также:
http://msdn.microsoft.com/en-us/library/ms693206%28v=vs.85%29.aspx
Шумовые слова действуют в качестве заполнителей в запросах фраз. Документ, содержащий текст «wag the dog», хранится в индексе с «wag» при возникновении 1 и «собака» при возникновении 3. Запрос фразы «wag dog» не соответствует, но фраза «wag a dog» «делает, потому что информация о происшествии соответствует
Где я получу этот файл звукового слова? Я нашел его в C: \ Windows \ System32. –
Каков ваш вопрос, если вы его уже нашли? –
Есть более 1 файла. noise.enu, noise.jpn, noise.data и т. д. Итак, какая служба индексирования файлов используется? –