На самом деле написание масштаба направлен искателя довольно сложная задача. Я реализовал его на работе и поддерживал его довольно долгое время. Есть много проблем, которые вы не знаете, пока не напишите и не столкнетесь с проблемами. В частности, речь идет о CDN и дружественном обходе сайтов. Адаптивные алгоритмы очень важны или вы отключите фильтры DOS. На самом деле вы будете так или иначе не зная об этом, если ваш ползание будет достаточно большим.
вещи думать о:
- Что кроме умелым пропускной способности?
- Как вы справляетесь с отключением сайта?
- Что произойдет, если вы заблокированы?
- Вы хотите заниматься скрытным сканированием (противоречивым и на самом деле довольно сложно получить право)?
Я на самом деле написал кое-что, что, если я когда-нибудь обойдусь, я мог бы разместить онлайн о строительстве гусеничного тракта, так как создание правильного гораздо сложнее, чем люди скажут вам. Большинство сканеров с открытым исходным кодом работают достаточно хорошо для большинства людей, поэтому, если вы можете рекомендовать использовать один из них. Какой из них - выбор функции/платформы.
Да! это книга, которая начала все это для меня. – KJW