Я работаю над анализом настроений, и я использую набор данных, приведенный по этой ссылке: http://www.cs.jhu.edu/~mdredze/datasets/sentiment/index2.html
, и я разделил свой набор данных на 50:50. 50% используются в качестве тестовых образцов, а 50% используются в качестве образцов поезда и характеристик, извлеченных из образцов поездов, и выполняют классификацию с использованием классификатора Weka, но моя точность предсказания составляет около 70-75%.Хороший набор данных для анализа настроений?
Может кто-нибудь предложить некоторые другие наборы данных, которые могут помочь мне увеличить результат - в качестве моих функций я использовал unigram, bigram и POStags.
Вы можете попробовать этот https://www.kaggle.com/data/36745#latest-205286 – Seremonia