В настоящее время я занимаюсь исследованиями анализа настроений в твиттере. Я хочу объединить предопределенный ресурс лексики, такой как знак полярности отправителя. а затем продолжить его машинным обучением. проблема заключается в получении правильной оценки sentiwordnet, предыдущая работа всегда просто выбирает общий балл отрицательной и положительной полярности значения слова. Я имею в виду, например, слово «сумасшедший» может отображаться в 3 раза отрицательным и в 2 раза положительными словами. Большинство предыдущих работ будут автоматически усредняться по каждой полярности. , поэтому я хочу устранить эти слова перед тем, как получить оценку, чтобы мы действительно могли использовать sentiwordnet, как и должно быть. Я думал, сравнивая подобие целевого предложения и предложения блеска. есть ли способ сравнить его? как вы думаете, он будет работать? если не поделитесь пожалуйста свою идею ..Значение смысла слова в sendiwordnet python
я новичок в этой области и начинающего программиста питона, поэтому я очень нужен совет от вас .. спасибо ..