Я хочу, чтобы реализовать очень простой веб-сканер с использованием Java, и я нашел эту библиотеку: crawler4j: http://code.google.com/p/crawler4j/некоторую информацию о сопоставлении с образцом в веб-crwaler Java с использованием crawler4j библиотеки
мне нужен искатель, который сделать следующее вещь:
Start из URL (specificated мной) и признает, если на текущей странице есть specifici слово, такие как собственное имя или название компании (также это слово указано мной)
Если найти это слово, текущий URL-адрес страницы должен быть сохранен в базе данных.
Таким образом, нет никакого семантического анализа, но только sintattic анализа (Crowler должны попытаться соответствовать содержанию веб-страницы с помощью какой-то знак, указанный мной)
Я бы знать, если этот маркер исследования (найти, если слово содержатся в текущей странице) это функция реализуется абстрактным классом Webcrawler спос craler4j или если я должен реализовать самого
TNX
Andrea