2016-08-16 5 views
3

У меня есть набор из примерно 6 миллионов маленьких предложений. Я пытался расширить эти предложения, используя каждое предложение в качестве запроса к Google и расширяя каждое предложение из результатов поиска.Ограничения API API для пользовательского поиска и, следовательно, альтернативы?

Тогда я обнаружил, что существует ограничение с GCI api, где вы не можете выпустить более 100 запросов/дней (это действительно TINY), а платная версия стоит так дорого.

Во время поиска я нашел что-то по телефону http://www.faroo.com/hp/api/api.html#ratelimit, но у них также есть ограничение на 1M запросов/месяц и учитывая количество запросов, которые я хочу сделать, это все равно займет 6 месяцев, которые я не могу себе позволить. Сканирование Результаты поиска (даже если это нарушает TOS) не будет работать, поскольку Google будет использовать Captcha или даже заблокировать мой IP-адрес при определении скорости запросов, которые сделает искатель.

Я был бы очень признателен за ваш вклад здесь ..? Знаете ли вы какой-либо другой источник, который удовлетворит мое требование?

ответ

1

Обход результатов поиска и использование услуги CAPTCHA - это единственный способ сделать это по бюджету. Если вы можете использовать несколько IP-адресов через прокси-сервер, то это преимущество, так как вы можете ограничить обход, чтобы избежать CAPTCHA как можно больше.

услуги Я использую для Google ползать:

+0

Но тогда вам придется делать всю предварительную обработку данных, структурирования, индексации и ранжирования документов к данный запрос? – KillBill

+0

«на бюджет» - я действительно не могу тратить на это деньги. Кажется, что нет свободного способа сделать это? – KillBill

+0

Если бы был бесплатный способ выполнять массовые поиски Google, не было бы много платных услуг, чтобы помочь вам в этом. Вы либо пиратствуете его с помощью собственной настройки, либо с помощью сервиса CAPTCHA, или вы можете заплатить кому-то за это. –