2012-09-17 5 views
1

Я использую API потоковой передачи Twitter. Он отлично работает для одиночных слов, но, по-видимому, не может фильтровать точным bigram (две строки слов).Кодирование пробелов для точного соответствия bigram в twitter streaming API track keywords

Я проверяю это путем поиска общих слов, которые обычно в комбинации:

e.g. "feel good" 

Это URL: (требуется OAuth логин):

https://stream.twitter.com/1.1/statuses/filter.json?track=keywords_go_here

Вещи, которые не работают:

track=feel%20good ==> still produces: "text":"Feels so good outside!..." 
track=%27feel%20good%27 ==> produces nothing 
track=feel%20good, ==> still produces "good that my friend has an ED too because I can feel..." 

Любые идеи о том, как это работает?

Редактировать: кто-то ответил на это в начале 2010 года: Twitter Streaming API - tracking exact multiple keywords in exact order, но есть ли какие-либо обновления по этой проблеме?

ответ

0

Похоже, вы можете сделать это поиск по API: https://dev.twitter.com/docs/using-search

«счастливый час», содержащий точную фразу «счастливый час»

Просто нужно поставить фразу в цитаты

+0

просто убедитесь, что вы правильно выбрали знак котировки – cubbuk

0

Я извиняюсь, но answer является

Точное совпадение фраз (эквивалентно цитируемым фразам в большинстве поисковых систем) не поддерживается.

Кроме того,

пунктуация и специальные символы будут рассматриваться как часть срока они находятся рядом.

Так что, если вы отслеживаете "feel good", вы будете получать сообщения, такие как

Он сказал, «чувствовать», и я ответил: «Я хороший».

Если вы хотите точные совпадения, то у вас есть два варианта:

A) отслеживаются оба термина, а затем отбросить все твиты, которые не имеют точных соответствий, или

B) получают платный подписка на брандмауэр Twitter с Gnip или DataSift. Twitter зарабатывает на жизнь такими вещами, поэтому я не думаю, что он будет доступен в Streaming API.