Я использую API-интерфейс Twitter Streaming для отслеживания нескольких ключевых слов/пользователей. Я планирую сбрасывать строки твитов json, которые я получаю из twitter непосредственно, как есть, в базу данных cassandra и после этого обрабатывать посылку.Сбрасывание твитов Twitter Streaming API as-is для Apache Cassandra для последующей обработки
Является ли такая конструкция практичной? Будет ли оно увеличиваться, когда у меня будет миллионы твитов?
Вещи, которые я буду делать позже, включают в себя получение верхних пользователей, верхних хэштегов и т. Д. Я хотел бы сохранить поток как есть для их добычи позже для любой новой информации, о которой я, возможно, не знаю.