Довольно простой вопрос Я надеюсь: кто-нибудь знает инструмент, который эффективно очистит сайты, созданные с помощью Microsoft Matrix? Я мог бы написать код в python, но это займет у меня намного больше времени, чем я думаю, что хочу посвятить задачу, а именно из-за очень плохого и уродливого HTML, созданного Matrix.Microsoft Web Matrix
Я пробовал Web Harvey, скребок гелия, и я попробовал плагин Web Scraper для Chrome. WebHarvey задохнулся от HTML и не смог загрузить последующие страницы. Helium Scraper смог переместиться с одной страницы деталей на другую (следующие ссылки были соблюдены), но контент из страниц деталей не был снят. Скребок веб-браузера Chrome не смог перемещаться по ссылкам, а всплывающее окно отображало страницу с ошибкой. Моя кишка говорит мне, что это связано с уникальными вещами ASP.net, но я могу ошибаться.
Любые указатели или предложения, оцененные.
Ваш хороший вопрос. Пожалуйста, подумайте над добавлением дополнительной информации об ошибках, с которыми вы сталкиваетесь. ПРЕДЛОЖЕНИЕ: Google «инструменты экранного экрана для страниц asp.net». Пожалуйста, сообщите нам, что вы нашли! – paulsm4