Мы отправляем канал GSA «метаданные и url» для некоторых PDF-файлов, которые не могут быть достигнуты при обычном сканировании. Наряду с URL-адресом PDF мы также представляем дополнительные метаданные. Канал завершается успешно, и PDF добавляется в индекс GSA (доступен в диагностике индекса и в результатах XML). Но отправленные метаданные игнорируются и рассматриваются только те метаданные, которые сама GSA извлекает, сканируя документ (автор и т. Д.).GSA feeds - отправленные метаданные игнорируются
Мы значительно ниже предела лицензии (даже не достигнув 50%).
Подачу запись выглядит следующим образом:
<record lock="true" action="add" mimetype="application/pdf" crawl-once="true" url="<PDF URL HERE>">
<metadata>
<meta content="md1value" name="md1name"/>
<meta content="md2value" name="md2name"/>
...
</metadata>
</record>
индексная страница диагностики показывает эти метаданные для PDF:
Metadata Name Metadata Content Metadata Content length
CreationDate D:20110622112810-04'00' 23
ModDate D:20110622112949-04'00' 23
Producer PDF-XChange 4.0.165.0 75
Так что нет записи для md1name и md2name. Пожалуйста помоги.
Да, я тоже это сделал. Не удалось получить метаданные. Кроме того, у нас не более 4-5 мета-записей, и иногда они появляются для некоторых документов. – Vasan
Если фид отправлен правильно без ошибок (Источники контента> Каналы), он должен отразить в результате xml. Это похоже на странное поведение. Поднимите билет поддержки с помощью Google. –