Я занимаюсь тематическим моделированием Twitter, чтобы определить профили пользователей invidual Twitter. Я использую модуль Gensim для создания модели LDA. Мой вопрос заключается в выборе хороших входных данных. Я бы хотел создать темы, которые я бы назначил определенным пользователям. Вопрос касается входных данных. Теперь я использую контролируемый метод выбора пользователей из разных категорий самостоятельно (спорт, ИТ, политика и т. Д.) И включение их твитов в модель, но это не очень эффективно и эффективно.Создание хорошей модели LDA для Twitter в Python с правильными входными данными
Что было бы хорошим методом для создания значимых тем всего Twitter?
Обратите внимание, что тема из моделирования темы - это нечто отличное от метки или класса в задаче классификации. Убедитесь, что вы хорошо поняли термины, которые используете, и подумайте о своем вопросе снова. Что вы хотите узнать? – jknappen