Мне нужно просканировать твиты, связанные с конкретным запросом за последние 1 неделю, используя библиотеку twitter4j. Я написал программу для массового сбора-пакетной перезагрузки, которую я провел всю ночь, чтобы собрать около 5 ГБ твитов. Я считаю, что они выбраны на 1% с помощью API Twitter. Мне нужны твиты, охватывающие неделю, но для меня это огромный объем данных. Мне просто нужны твиты, которые только что были представлены на прошлой неделе. Мне было интересно, есть ли способ контролировать частоту дискретизации через конфигурацию twitter4j.twitter4j - контроль частоты дискретизации
0
A
ответ
0
Вы не можете уменьшить частоту дискретизации, вы должны сделать подход, который удовлетворит вас, например, принять 10% случайных твитов, которые будут вспоминаться в течение часа или с помощью filters ... все, что вам нравится!
Я очень благодарен, если вы прокомментируете причину голосования по голосу. Есть ли что-то неправильное или непонятное в вопросе? –
Вы не можете уменьшить частоту дискретизации, вы должны сделать подход, который вам понравится, например, принять 10% случайных твитов, которые можно вспомнить в течение часа или использовать некоторые фильтры ... что угодно! – FeanDoe
Да. Вот как я его реализовал. Спасибо за ваш ответ. Вы можете добавить это, чтобы ответить. –