Я хочу, чтобы пользователи, которые чирикают о одной вещи, также чирикают о чем-то другом. Я использовал пакет TwittR в студии R для загрузки твитов, содержащих ключевые слова, а затем загрузил временные рамки этих пользователей в python. Мои данные структурированы следующим образом.Как структурировать данные для алгоритма Apriori?
user_name, идентификатор, created_at, текст
exampleuser, 814495243068313603,2016-12-29 15:36:13 «MT @ nixon1788: Обама и левые отвратительны антисемитские блюет! #WithdrawUNFunding '
Возможно ли использовать алгоритм априори для генерации правил ассоциации? Кто-нибудь знает, как структурировать эти данные, чтобы использовать его, или если это возможно с данными, которые у меня есть?
увидеть [г пакет arule] (https://cran.r-project.org/web/packages/arules/index.html) –
Каких ассоциаций вы хотите определить здесь? Ассоциации между хэштегами. Или ассоциации между именем Обамы и отрицательными твитами. В любом случае, я думаю, что предложение @ImranAli пройдет долгий путь. – Abdou
Привет, спасибо за ответ, я хочу использовать ключевые слова (поэтому, если кто-то твит использует слово obama, они также будут чирикать, используя слово «clinton», например), моя проблема заключается в том, что я не знаю, как принуждать мои данные к транзакционным данные для использования с этим пакетом. – John