0

В настоящее время я работаю над приложением для поведенческого таргетинга, и мне нужна значительно большая база данных ключевых слов/инструмент/поставщик, которая позволяет приложениям достигать аналогичных ключевых слов через заданное ключевое слово для моего приложения. Недавно я обнаружил, что Freebase, которая предоставляла аналогичную услугу до того, как Google их приобрела, а затем интегрировала в свой График знаний. Мне было интересно, возможно ли иметь список связанных тем/ключевых слов для данного объекта.Поиск похожих тем, используя API-интерфейс Google Knowledge Graph

import json 
import urllib 

api_key = 'API_KEY_HERE' 
query = 'Yoga' 
service_url = 'https://kgsearch.googleapis.com/v1/entities:search' 
params = { 
    'query': query, 
    'limit': 10, 
    'indent': True, 
    'key': api_key, 
} 
url = service_url + '?' + urllib.urlencode(params) 
response = json.loads(urllib.urlopen(url).read()) 
for element in response['itemListElement']: 
    print element['result']['name'] + ' (' + str(element['resultScore']) + ')' 

Сценарий выше возвращает ниже запросы, хотя я хотел бы получить темы, связанные с йогой, такие как здоровье, фитнес, тренажерный зал и так далее, а не то, что имеет слово «йога» в их имя.

Yoga Sutras of Patanjali (71.245544) 
Yōga, Tokyo (28.808222) 
Sri Aurobindo (28.727333) 
Yoga Vasistha (28.637642) 
Yoga Hosers (28.253984) 
Yoga Lin (27.524054) 
Patanjali (27.061115) 
Yoga Journal (26.635073) 
Kripalu Center (26.074436) 
Yōga Station (25.10318) 

Я бы очень признателен за любые предложения, и я также открыт для использования любого другого API, если есть, что я мог бы использовать. Приветствия.

ответ

1

См. Ваш вопрос :) Итак, вот сценарий, который я использую для этого, используя API Serpstat. Вот как это работает:

  1. Скрипт собирает ключевые слова из базы данных Serpstat в
  2. Затем собирают предложения поиска из базы данных Serpstat в
  3. Наконец, собирает предложения поиска из предложений Google,

Обратите внимание, что, чтобы сделать скрипт работает правильно, желательно заполнить все поля ввода. Но не все они требуются.

  • Ключевое слово - требуется ключевое слово
  • Search Engine - поисковая система, для которой анализ будет проводиться. Например, для Google Google вам необходимо установить g_us. Весь список доступных поисковых систем можно найти here.

Ограничить максимальное количество фраз из органического вопроса, который будет участвовать в анализе. Здесь вы не можете установить более 1000.

  • По умолчанию ключи - список ключевых слов с двумя словами. Вы должны дать каждому из них некоторый «вес», чтобы получить какой-то результат, если что-то пойдет не так.

Формат: тип, ключевое слово, «вес». Каждое ключевое слово должно быть написано из новой строки. Типы:

W - одно слово

р - два слова

Примеры:

"ш; бутылка; 50" - начальный вес слова бутылки 50.

" p; пластиковая бутылка, 30 "- начальный вес фразы пластиковой бутылки равен 30.

" w, пластиковая бутылка, 20 "- неверно. Вы не можете использовать двухсловную фразу для типа «w».

Плохие слова - список слов, которые вы хотите, чтобы сценарий исключался из результатов.

Token - здесь вам нужно ввести свой токен для доступа к API. Его можно найти на странице вашего профиля.

Вы можете скачать исходный код для скрипта here