2009-07-07 2 views
2

Я работаю с клиентом, чтобы перенести веб-сайт с существующего производственного оборудования в новую аппаратную среду. Сейчас кажется отличным временем для проведения аудита и удаления любого старого или устаревшего контента, а не просто слепо скопировать его снова.Инструменты для очистки содержимого веб-сайта?

Есть ли хорошие бесплатные инструменты или скрипты, которые я могу использовать для сравнения веб-доступного контента на сервере с фактическими файлами на сервере, чтобы узнать, какой контент на самом деле связан и используется?

Заранее благодарим за любую помощь!

ответ

0

Я уверен, что есть, но я уверен, что нет такого, который мог бы сделать лучшую работу, чем вы могли бы сами, знаете ли? Насколько велик этот сайт, и вы сами его кодировали?

+0

Сайт очень большой, где-то в диапазоне 2-3 000 страниц, а также ссылки на изображения и файлы. Это не практично делать это вручную. Я мог написать сценарий для разбора каждой страницы, извлечения ссылок и проверки их до завершения, записи каждой найденной страницы. Затем сравните с файловой системой, но это займет много времени. Я не первый человек, который должен сделать это, поэтому я думаю, что должен быть какой-то бесплатный инструмент с открытым исходным кодом, который мог бы помочь, я просто не знаю об этом. –

2

Ну, для начала вы можете использовать такой инструмент, как Xenu's Link Sleuth, чтобы паучьте все ваши страницы, чтобы найти неработающие ссылки и тому подобное. Мы использовали этот инструмент в нашей интрасети, чтобы найти и исправить наши неработающие ссылки. Это бесплатно и выполняет свою работу.

Другим инструментом, который мы использовали для миграции между системами, является поисковая система. Хорошая поисковая система будет охватывать все ваши страницы и показывать двусторонние отношения между ссылками. Это может помочь вам найти, какой контент связан с большинством и тем, что может стать сиротой. К сожалению, этих видов инструментов не являются бесплатными.