2012-02-06 4 views
0

Я пытаюсь настроить фильтр для пользователей по типу файла.Google Search Appliance - лучший способ фильтрации filetype

С помощью специальных условий запроса File Type Filtering или File Extension Filter добавляет текст в конец условия запроса. Что в свою очередь отображает «abc etx: pdf», а также добавляет, что предложения вряд ли идеальны.

Настройка отдельного переднего конца для каждого типа файлов или использование as_filetype также приводит к аналогичному затруднительному положению.

Я действительно не хочу создавать отдельные коллекции для каждого, потому что тогда у меня будет более 70 коллекций (есть 10 сайтов, которые я сканирую).

Есть ли другие альтернативы, которые фильтруют результаты с помощью mime или extension, которые не добавляются к запросу? Каков наилучший способ фильтрации с помощью mime или extension?

+2

ли вы найти решение для этого? Я также ищу то же самое – GoodSp33d

+1

Nah, после нескольких часов поиска я пришел к выводу, что создание десятков коллекций - лучшее решение. Он не мешает запросам и имеет лучшую производительность. –

ответ

0

Если расширение файла отображается в его URL-адресе, вы можете использовать распознавание сущностей, чтобы добавить специальную запись метаданных с расширением файла в качестве значения. Или вы можете вернуть специальный HTTP-заголовок ответа с вашего веб-сервера для файла, который вы можете настроить в GSA в качестве дополнительных метаданных для файла.

После того, как у вас есть определенное поле метаданных для файла (ов), вы можете использовать параметр requiredfields для фильтрации для них, не загрязняя условия поиска. Например, говорят, что все PDF-файлы имеют поле метаданных с именем «FileType» со значением, как «PDF» Поиск URL будет выглядеть

...&q=<what user searched>&requiredfields=FileType:PDF