2013-12-10 3 views
0

Может ли кто-нибудь сказать мне, что именно означает слово «шум» в службах индексирования? Я работаю над службами индексирования серверов Windows и получаю много проблем. Some questions on it: Does indexing services not search for noise words? What is the location and name of noise word file on windows server? Спасибо.«Шумное слово» в службах индексирования

ответ

0

Они являются такими же, как стоп-слова:

https://en.wikipedia.org/wiki/Stop-words

В вычислительной технике, стоп-слова есть слова, которые отфильтрованы до, или после, обработки данных на естественном языке (текст). Существует не один определенный список стоп-слов, которые используются всеми инструментами, и такой фильтр не всегда используется. Некоторые инструменты специально избегают их удаления для поддержки поиска фразы.

Смотрите также:

http://msdn.microsoft.com/en-us/library/ms693206%28v=vs.85%29.aspx

Шумовые слова действуют в качестве заполнителей в запросах фраз. Документ, содержащий текст «wag the dog», хранится в индексе с «wag» при возникновении 1 и «собака» при возникновении 3. Запрос фразы «wag dog» не соответствует, но фраза «wag a dog» «делает, потому что информация о происшествии соответствует

+0

Где я получу этот файл звукового слова? Я нашел его в C: \ Windows \ System32. –

+0

Каков ваш вопрос, если вы его уже нашли? –

+0

Есть более 1 файла. noise.enu, noise.jpn, noise.data и т. д. Итак, какая служба индексирования файлов используется? –