2015-12-09 1 views
0

При использовании распознавания сущностей в GSA он работает только с «контентом» сайта/документа или же он также работает для извлечения определенных частей существующих метаданных?Извлечение контента с помощью распознавания сущности по существующим метаданным в GSA

У меня есть метаданные, которые я хочу извлечь только для части содержимого метаданных, соответствующей регулярному выражению. Возможно ли это с распознаванием GSA Entity? Или, возможно, другой инструмент в Google Search Appliance.

ответ

1

Распознавание объектов может извлекать объекты только из содержимого и URL-адресов документа.

Для очистки метаданных у вас есть несколько вариантов:

  • сделать это в исходном репо
  • использовать в DOC фильтр или преобразования, если он питается через разъем
  • использовать метаданные и URL подать для добавления новых (дезинфицированных) метаданных
+0

Я пытаюсь очистить некоторые плохие метаданные. Например. содержание метаданных 'Subject; Cars'. Проблемы в том, что я только хочу извлечь «Автомобили». Но похоже, что распознавание объектов не позволяет этого. –