2013-08-29 2 views
13

У меня есть небольшой веб-сайт, который я пытаюсь зеркально отобразить на своей локальной машине только с html-файлом, без изображений, файлов с прикрепленным изображением ... pdf, ..etc.Wget Зеркало только HTML

Я никогда не отражал сайт раньше и думаю, что было бы неплохо задать вопрос, прежде чем делать что-либо катастрофическое.

Это команда, которую я хочу запустить, и задаюсь вопросом, нужно ли добавлять что-либо еще.

wget --mirror <url> 

Спасибо!

ответ

17

-R и -A опция используется для отклонять или принимает определенных типов файлов.

Также рассмотрим пропускную способность, используемую для загрузки всего веб-сайта. Вы также можете добавить опцию --random-wait.

Если вы хотите, чтобы пропустить все изображения и PDF-файлы, ваша команда будет выглядеть примерно так:

wget --mirror --random-wait -R gif,jpg,pdf <url> 

Примечание: зеркальное отображение веб-сайта может пойти против политики, поэтому я предлагаю вам проверить.

Источники:

2

Есть также Wget патчи, добавляющие варианты MIMETYPES фильтрации ...