2012-12-08 4 views
-1

Недавно я написал собственный веб-искатель/паук с использованием Java и JSoup (http://jsoup.org/) HTML-парсера. Веб-искатель очень рудиментарный - он использует методы Jsoup connect и get, чтобы получить источник страниц, а затем другие методы JSoup для анализа содержимого. Он случайным образом следует почти всем ссылкам, которые он находит, но не имеет смысла пытаться загружать файлы или выполнять скрипты.Опасность для вирусов и вредоносных программ при веб-обходе

Искатель выбирает семенные страницы из длинного списка по существу случайных веб-страниц, некоторые из которых, вероятно, содержат контент для взрослых и/или вредоносный код. Недавно, когда я запускал искатель, мой антивирус (Avast) помешал одному из запросов в качестве «обнаруженной угрозы». Оскорбительный URL-адрес выглядел злонамеренным.

Мой вопрос: может ли мой компьютер получить вирус или какие-либо вредоносные программы через мой веб-искатель? Есть ли какие-либо меры предосторожности или проверки, которые я должен ввести в действие?

ответ

3

В теории, он может.

Однако, поскольку вы не выполняете Flash и подобные плагины, а обрабатываете только текстовые данные, вероятность довольно высока, что ваш HTML-парсер не имеет известной уязвимости.

Кроме того, все вирусы и почтовые веб-сайты нацелены на группы больших пользователей. Пользователей, использующих JSoup, мало. Большинство из них, например, используют Internet Exploder. Вот почему вирусы нацелены на эти платформы. В наши дни Mac OSX становится все более привлекательной. Я только что прочитал о новой вредоносной программе, которая заражает пользователей Mac OSX только с помощью некоторой старой проблемы безопасности Java, когда они посещают веб-сайт. Он был найден на сайтах, связанных с Далай-ламой, поэтому, возможно, это китайский.

Если вы действительно параноик, настройте в вашей системе «никого» пользователя, который вы сильно ограничите. Это лучше всего работает с Linux. В частности, с SELinux вы можете сузить разрешения веб-искателя до такой степени, чтобы вы могли остановить его от доступа к чему-либо, кроме загрузки внешнего веб-сайта и отправки результата в базу данных. Затем злоумышленник может только сбой вашего искателя или, возможно, злоупотреблять им при атаке DDoS, но не повреждать или перехватывать вашу систему.

 Смежные вопросы

  • Нет связанных вопросов^_^