2015-07-09 3 views
3

Вчера у нас была проблема, которая мешала gsa-гусеницу входить на наш сайт для сканирования. Из-за этого многие URL-адреса индексируются как страница входа в систему. Я вижу много результатов на странице поиска под названием «Пожалуйста, войдите» (название страницы входа). Также, когда я проверяю Index Diagnostics, статус обхода для этих URL-адресов «Retrying URL: Connection reset by peer during fetch.».Как пересканировать документы, у которых есть статус ошибки

Теперь проблема входа в систему устранена, и как только страница перескакивается, статус обхода переходит в успешный, и он поднимает содержание страницы, и результаты поиска отображаются с соответствующим заголовком. Но поскольку я не могу контролировать, что происходит сканирование, есть страницы, которые до сих пор не пересканированы и все еще имеют проблему.

Существует не единый URL-адрес, который я могу заставить повторно обход. Отсюда мой вопрос: Есть ли способ принудительного повторного обхода на основе состояния обхода («Retrying URL: Connection reset by peer during fetch.»)? Если это конкретно вопрос о повторном обходе на основе типа статуса обхода (Errors/Successful/Excluded)?

ответ

2
  1. Экспорта все URL ошибки в CSV-файл с помощью «Индекса> Диагностика> Index Диагностика»

  2. Открыть CSV и применить фильтр на состоянии ползать Colum и получить URLs, имеющие ошибки вы ищете ,

  3. Скопируйте эти ссылки и Гото «Источники контента> Веб-сканирование> Настройка> повторное сканирование этих шаблонов URL» и вставьте и нажмите на повторное сканирование

Вот так. Вы сделали!

PS: Если URL-адрес ошибки больше (> 10000, если я не ошибаюсь), возможно, вы не сможете получить все из них в одном файле csv. В этом случае вы можете делать это партиями.

С уважением,

Mohan

+0

Спасибо. Я думал об экспорте, но не знал, что есть место для копирования этих URL-адресов для повторного обхода. Вы знаете, существует ли ограничение на количество URL-адресов для отправки сразу в форме «Настройка свежести»> «Образцы URL-адресов»? – icramc

+0

Экспорт с помощью Index Diagnostics имеет ограничение в 10 000 URL-адресов, если вы используете кнопку «Экспорт всех страниц в файл». Для экспорта вам лучше использовать выделенную функцию «Экспорт URL-адресов»: «Индекс»> «Диагностика»> «Экспорт URL-адресов», которые не имеют предела 10 тыс. (Но может привести к слишком большому файлу, чтобы открыть его в Excel, если вы не выполняете фильтрацию). Я не знаю никаких ограничений на количество URL-адресов, которые вы можете вставить в это поле в настройке свежести, но поскольку он отправляет строковые данные в GSA, не слишком сумасшедший и делайте их в партиях, чтобы убедиться, что вы Не пропустите. – BigMikeW

+0

Извините, я понятия не имею, как ограничить количество URL-адресов, отправляемых на настройку свежести. –