Реактор noob здесь.Reactor 3.x (Java): для веб-соскабливания
Это более чем вопрос.
Предположим, у меня есть веб-сайт, который я хочу очистить, содержащий постраничный набор результатов поиска. Количество страниц результатов поиска неизвестно. На каждой странице поиска есть ссылка на следующую страницу. Я хочу очистить все результаты поиска от всех страниц и обработать каждый результат поиска.
Как я могу использовать Reactor (Mono/Flux), чтобы выполнить это на Java?
Я хочу сделать это как можно «реактивно».
В основном, версия Reactor (3.x) следующий императивного псевдокод:
String url = "http://example.com/search/1";
Optional<Document> docOp = getNextPage(url); (1)
while (docOp.isPresent()) {
Document doc = docOp.get();
processDoc(doc); (2)
docOp = getNextPage(getNextUrl(doc)); (3)
}
// (1) Get the first page of search results
// (2) Process all the search results on this page asynchronously
// (3) Find the next page URL, and get that page