2016-01-08 2 views
2

Я использую WGET, чтобы очистить два почти идентичных сайтов.Остановить WGET от возврата страниц Wordpress?

Затем я планирую запустить DIFF, чтобы найти какие-либо отличия. (Я двигаюсь сайт на новый сервер в основном и хочу, чтобы убедиться, что все до нуля)

Вот мои результаты от моего соскоба на старом и на новом сервере:

enter image description here

Ниже вы можете увидеть, что на новом сервере есть много файлов index.html?p=?.

Мне удалось разобраться, что это связано с тегом в коде, ссылающимся на «короткую ссылку» на странице. Это втягивается через плагин под названием «Yoast», который существует на новом сервере, но не в старом. Кроме этого, сайт почти точно идентичен. (Даже настройки сервера и т.д.)

(Есть более 2000 этих индексных файлов в каталоге)

enter image description here

мне нужны результаты каждого WGET быть тем же самым, так что я могу DIFF два места.

Это тег в коде вызывает это произойдет на новом сервере:

enter image description here

Теперь главный вопрос. Как я могу сделать WGET игнорировать эти теги короткой ссылки и очистить сайт, как это было бы на старом сервере?

Я пробовал всевозможные различные параметры WGET, но пока ничего не обработано. Это моя текущая WGET команда:

wget --recursive --html-extension --page-requisites --convert-links www.domain.ac.uk 

Как я могу изменить эту команду, чтобы игнорировать тег «Shortlink»?

Спасибо


Я обнаружил, как удалить фактическую метку. Это не исправление для меня, потому что мне нужно тег там, но и для других людей, которые приходят через это, добавьте в ваш functions.php:

remove_action('wp_head', 'wp_shortlink_wp_head', 10, 0); 
+0

Вы можете удалить сам тег: 'remove_action ('wp_head', 'wp_shortlink_wp_head', 10, 0);' –

ответ

1

Не работает это, но если вы также владелец веб-сайт, который вы сканируете, вы можете просто добавить:

remove_action('wp_head', 'wp_shortlink_wp_head', 10, 0); 

К вашим функциям.php, чтобы скрыть метатег.