Я пытаюсь очистить все заголовки сообщений, связанные с заданными условиями поиска от определенных субредадов в течение заданного периода времени, используя R. Пакет «RedditExtractoR» действительно полезен, поскольку я может использовать эту строку кода, чтобы вернуть все соответствующие сообщения, а также какой-либо другой полезной информации:Задание таймфрейма при очистке от reddit с помощью RedditExtractoR в R
> reddit_urls(search_terms = 'immigrant', subreddit = 'ukpolitics', page_threshold = 5, sort_by = "new")
Моя проблема, этот код возвращает каждое сообщение от прямо сейчас, пока порог страница не заполнится, что в этом дело бывает на пару месяцев старше, чем мне нужно, поскольку я устанавливал произвольный «page_threshold», когда я тестировал код. Мои временные рамки - с 9 сентября 2015 года по 23 июня 2016 года (отметки времени unix равны 1441411201 & 1466726401 соответственно, если это имеет значение), и, следовательно, у меня есть несколько месяцев лишних данных по обе стороны от моего временного интервала.
Есть ли способ включить аргумент какого-либо рода для ограничения вывода на заданный период времени? такие как «from = X», «unitl = X» или «timeframe = X..X» (аргументы, которые я видел в других пакетах раньше).
Спасибо.
Я чувствую, что это так так близко к тому, что я ищу, но мое понимание всего этого действительно рудиментарным и я не совсем понимаю, что вы подразумеваете под конец. Помогло бы мне включить код или результаты функции, так как вы не можете получить пакет, где находитесь? Я чувствую, что должен использовать «Data_out $ search_date» или что-то подобное, но я не уверен. –
Надеюсь, что это поможет. Определенно, что вы собираетесь использовать этот пакет, вы сдерживаете нарушение reddit api! – DataJack