Я пытаюсь получить конкретную информацию из обходного содержимого. Поскольку nutch сбрасывает весь текст веб-сайта, мне сложно получить конкретный контент. Я хочу добавить разделитель к обтекаемому текстовому контенту, который я индексирую в эластичном поиске.Добавление разделителя в содержимом обхода ореха
См., Например, при сканировании данных http://example.com/ данных, которые получают проиндексированы в elasticsearch является
Example Domain Example Domain This domain is established to be used for illustrative examples in documents. You may use this domain in examples without prior coordination or asking for permission. More information...
Я хочу, чтобы быть в формате
Example Domain | Example Domain | This domain is established to be used for illustrative examples in documents. You may use this domain in examples without prior coordination or asking for permission. | More information...
Можем ли мы определить этот разделитель где-то в Nutch конфигурации?
Thanks.That было полезно – vibhash
Рад, что это помогло! –