Моя цель состоит в том, чтобы использовать WEKA классифицировать кучу твитов к заранее определенному набору из 3 классов (скажем новости, образование, спорт)N сложите перекрестной проверки в WEKA для классификации твит
В этом случае обучающего набора и тестирования set - разные. (Обучение длинных веб-страниц, тестирование только одного или двух линейных твитов).
Как выполнить проверку пересечения «N» для этой проблемы.
Нужно ли смешивать данные подготовки и тестирования, чтобы подбирать один файл и применять проверку перекрестной скрещивания «n» или мне нужно сначала обучить классификатор, а затем применить проверку перехода «n» для тестового набора в weka.
Я предполагаю, что последнее имеет смысл, но я не уверен. Пожалуйста, помогите мне разобраться в этой проблеме.