Мне нужно сбросить данные с Nutch 2.3 в файл WARC. Однако я не смог найти необходимый модуль. У Nutch 1.x была эта возможность. Я хотел бы знать правильный способ сделать это.Как сбрасывать данные Nutch 2.3 в файл WARC?
0
A
ответ
1
Как вы уже сказали, в настоящий момент модуль экспортера WARC еще не портирован на ветку 2.x Nutch, тем не менее, портирование модуля https://github.com/apache/nutch/blob/master/src/java/org/apache/nutch/tools/warc/WARCExporter.java вряд ли будет таким сложным. Как правило, ветвь 1.x Nutch все еще используется и лучше оборудована, чем ветвь 2.x (по крайней мере, на данный момент).