Я пробовал наивный классификатор заливов, и он работает очень плохо. SVM работает немного лучше, но все еще ужасно. Большинство статей, которые я читал о SVM и наивных заливах с некоторыми вариациями (n-gram, POS и т. Д.), Но все они дают результаты, близкие к 50% (авторы статей говорят о 80% и высоких, но я не могу получить точные точные по реальным данным).Хороший алгоритм анализа настроений
Есть ли более мощные методы, кроме лексиксальных анализов? SVM и Байес полагают, что слова независимы. Этот подход называется «сумкой слов». Что, если мы предположим, что эти слова связаны?
Например: используйте алгоритм apriory, чтобы обнаружить, что если предложения содержат «плохой и ужасный», то вероятность 70% этого предложения отрицательна. Также мы можем использовать расстояние между словами и так далее.
Это хорошая идея или я изобретаю велосипед?
Что вы думаете об априорном алгоритме и ассоциации между словами? – Neir0
@ Neir0: Я не сразу вижу, как вы хотите применить его. Я также никогда не видел попыток провести с ним анализ настроений. Я знаю, что некоторые люди используют его для построения приближений к квадратичному ядру (примерно то, что вы называете «ассоциациями слов»), но затем я сначала попробую SVM ванильного ядра. –
Простой способ ввода жетонов с значком neg или pos. Например: «Я люблю свою маму». На выходе я получаю что-то вроде «если у нас есть любовь и мама в спайках, тогда 70%, что у нас есть значок». Конечно, мы можем изменить этот подход для достижения лучших результатов. – Neir0