2016-12-10 8 views
0

Я пытаюсь загрузить некоторые URL-адреса с помощью wget. Я получаю файлы без проблем, кроме этой ссылки Offensive-Security-ICQ и любой другой ссылки на www.offensive-security.com.Содержимое защищенных файлов безопасности не читается с помощью wget

Я пробовал как в Linux, так и в Windows со многими испытаниями и большим количеством поиска, но напрасно.

Я использую эту команду «Wget https://www.offensive-security.com/pwbonline/icq.html»

Приведенное файл показывает эти символы, и это ANSI декодируется enter image description here

Как я могу решить эту проблему ??

+0

Что делает Вы думаете, что загрузка не удалась? Это может быть только содержимое загруженного вами файла ... О, и, пожалуйста, избегайте публикации бесполезных снимков экрана, это не дает дополнительной информации и стоит намного больше (дисковое пространство, сеть ...) – kebs

+0

Не могли бы вы изменить вопрос и вставить точную командную строку, которую вы использовали для получения этого файла. Может помочь. – kebs

+0

Я редактировал вопрос. –

ответ

1

По какой-то причине сервер не возвращает html-страницу, кроме ее zipped-версии. Файл, который вы получаете идентифицируется как GZIP сжатых данных:

$ file icq.html 
icq.html: gzip compressed data, from Unix 

Таким образом, вы можете просто распаковать его, и вы получите правильный HTML-страницу.

Почему сервер делает это: не уверен, но это, вероятно, какой-то параметр по умолчанию, который остался как есть, поэтому вы можете скачать быстрее.

Как можно напрямую загрузить содержимое html: возможно, отправив некоторый общий пользовательский агент и заголовок, чтобы сервер думал, что его общий веб-браузер выполняет запрос вместо инструмента загрузки.

Это может быть сделано с помощью wget несколько вариантов, например, это должно работать:

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" https://www.offensive-security.com/pwbonline/icq.html 
+0

Большое вам спасибо. Оба решения работали отлично. Мое почтение. –