0

Я хочу, чтобы загрузить ниже документации с использованием logstash сделать индексацию его эластичным поиска:индекс документации URL со стеком ELK

https://www.ibm.com/support/knowledgecenter/SSEPGG_10.1.0/com.ibm.db2.luw.common.doc/doc/t0020018.html

В настоящее время я нахожусь в состоянии индексировать все журналы с elasticsearch, но я не уверен, как индексировать документацию с помощью URL-адреса.

Этот сценарий действителен с помощью logstash, если да, пожалуйста, помогите мне в этом.

ответ

0

Вы могли бы дать ему идти, используя http poller плагин, который был released недавно, в вашем logstash самой конфигурации. input может выглядеть примерно так:

input { 
    http_poller { 
    urls => { 
     myurl=> "https://www.ibm.com/support/knowledgecenter/SSEPGG_10.1.0/com.ibm.db2.luw.common.doc/doc/t0020018.html" 
     } 
    } 
    request_timeout => 60 
    interval => 60 
    codec => "json" <--- to decode the results to json 
    } 
} 

выше всего лишь пример, чтобы вы могли воспроизвести. Надеюсь это поможет!

+0

Спасибо за информацию, кажется, работает, но как загрузить все данные, если я даю ссылку главного url, чтобы она загружала все подъязыки/темы данного URL-адреса, предположим, если я дам https: // www .ibm.com/support/knowledgecenter/SSEPGG_10.1.0/com.ibm.db2.luw.kc.doc/welcome.html , он будет загружать все темы этого продукта также ... – Anand

+1

@AkshayAnand I don ' Думаю, он автоматически подберет все югу от URL-адреса мастера. Возможно, вам придется использовать несколько URL-адресов в свойстве ** urls **. – Kulasangar

+0

Я думал то же самое, но лучше включить какую-то логику для подбора всех сублинков ... – Anand