0

Моя цель состоит в том, чтобы использовать WEKA классифицировать кучу твитов к заранее определенному набору из 3 классов (скажем новости, образование, спорт)N сложите перекрестной проверки в WEKA для классификации твит

В этом случае обучающего набора и тестирования set - разные. (Обучение длинных веб-страниц, тестирование только одного или двух линейных твитов).

Как выполнить проверку пересечения «N» для этой проблемы.

Нужно ли смешивать данные подготовки и тестирования, чтобы подбирать один файл и применять проверку перекрестной скрещивания «n» или мне нужно сначала обучить классификатор, а затем применить проверку перехода «n» для тестового набора в weka.

Я предполагаю, что последнее имеет смысл, но я не уверен. Пожалуйста, помогите мне разобраться в этой проблеме.

ответ

0

Характер ваших данных должен быть одинаковым в обучении и заданном наборе. Это требование делает метод N-кратной перекрестной проверки применимым.

Для задач, связанных с выбором модели, посмотрите на это: https://vimeo.com/29569892