2012-03-04 3 views
0

Я пишу код скреперной ссылки, где я надеялся захватить только раздел <head> данной веб-страницы. По-видимому, я был смущен тем, что такое запрос HEAD, поскольку я думал, что это должно было сделать именно это. Вместо этого он просто возвращает заголовки HTTP.Запросы HEAD против получения только `<head>` веб-страницы

Есть ли способ получить только раздел <head> данной страницы, не получив весь документ?

ответ

2

Нет, в протоколе HTTP нет данных, которые вообще не знают о HTML. Вам нужно будет сделать правильный GET или POST, используя анализатор HTML, чтобы извлечь нужные данные.

Единственное, что вы могли бы сделать, чтобы ограничить то, что вы вернетесь, это использовать заголовок Range, но это будет просто угадать с вашей стороны, сколько данных вы запрашиваете.

+0

Хороший ответ- спасибо – Yarin