2014-02-26 4 views
0

Я взял сайт Intranet, который имеет ~ 20K документов, которые были связаны в одно и то же время в течение 7 лет. Примерно 2,8 тыс. Документов связаны между собой. Есть ли способ или инструмент для создания списка документов в серии папок, которые НЕ связаны, поэтому я могу удалить?Удаление документов с сайта, которые не связаны

Я знаю, что это не вопрос «программирования», но я уверен, что я не единственный веб-программист, столкнувшийся с этой дилеммой.

ответ

0

Я думаю, что вы могли бы получить то, что вы хотите использовать следующие шаги:

  1. Создать список файлов на диске с помощью команд операционной системы, как dir или ls
  2. списка Построить связанные документы с использованием Xenu Link Sleuth или аналогичным инструмент ,
  3. Найти все записи в первом списке, которых нет во втором списке.
  4. Удалить файлы, которые соответствуют записям, найденным на шаге 3
  5. Запустите Xenu Link Sleuth еще раз, чтобы убедиться, что вы ничего не удалили.

 Смежные вопросы

  • Нет связанных вопросов^_^