Я не» t знать, какой язык программирования вы используете, но общая идея заключается в загрузке страницы поиска Google с правильными настройками cookie (то есть, как они хранятся на момент написания этой статьи).
Вы можете установить, а затем просмотрите файлы cookie в Google Chrome. Чтобы избежать ненужных файлов cookie, начните с открытия нового окна инкогнито (Ctrl + Shift + N) и переход к настройкам поиска (https://www.google.com/preferences).
На момент написания статьи вы хотите проверить «Никогда не показывать мгновенные результаты», а затем настроить ползунок «Результаты на страницу» на любое значение, которое вы хотите. После нажатия «Сохранить» внизу вы можете просмотреть свои файлы cookie, открыв консоль разработчика (Ctrl + Shift + 10 J) и перейдите на вкладку ресурсов.
Снова, на момент написания, Google устанавливает две переменные: NID
и PREF
. PREF
- это тот, который нас интересует, чтобы изменить результаты поиска. Пример того, что она может выглядеть следующим образом:
ID=8155cce71859f7d0:U=fe6e69e174148b7b:FF=0:LD=en:NR=40:TM=1379366492:LM=1379366586:SG=2:S=FoybwBhek8noyp0t
(Эта кнопка выбирает 40 результатов, как указано на NR=40
)
С помощью этого ключа (PREF
) и значение для него (как показано выше), вы можете отправить cookie при запросе страницы через wget, curl и т. д. В моем последнем проекте, связанном с этим, я использовал node с requests library.
Вот отрывок о том, как вы можете идти о выборке страницы Google с 40 результатами (модифицированный пример из документации запросов):
var j = request.jar();
var cookie = request.cookie('PREF=ID=8155cce71859f7d0:U=fe6e69e174148b7b:FF=0:LD=en:NR=40:TM=1379366492:LM=1379366586:SG=2:S=FoybwBhek8noyp0t');
j.add(cookie);
request({url: 'https://www.google.com/search', jar: j},
function(error, response, body) {
// do something with the body (html) of the page!
});
Или взглянуть на человека страниц для Wget/локон. Я знаю, что wget указывает флаг --load-cookies
, который вы можете использовать.
Вы можете применить это к любому другому веб-сайту на основе файлов cookie, в котором вам нужен контент. Yahoo! использует настройки на основе файлов cookie - я не уверен, что использует Bing.
Этот вопрос относится к [Web Applications SE] (http://webapps.stackexchange.com/). – unor