2016-03-26 8 views
1

Я хочу использовать SentiWordNet для моего проекта, и я не мог понять, что делает номер смысла do? Вот часть списка слов SentiWordNet;В чем смысл номера смысла в SentiWordNet?

POS-ID PosScore NegScore SynsetTerms Глянец

00002730 0 0 acroscopiC# 1 облицовочный или на стороне по направлению к вершине

00002843 0 0 basiscopiC# 1 облицовочного или на стороне, обращенной к основанию

a 00003829 0,25 0 parturient # 2 рождение; «родительская телка»

Вот объяснение SentiWordNet из его документа списка слов;

Пара (POS, ID) уникально идентифицирует синхронизацию WordNet (3.0). Значения PosScore и NegScore представляют собой положительный и отрицательный результат , назначенный SentiWordNet для синхронизации. Оценка объективности может быть , рассчитанная как: ObjScore = 1 - (PosScore + NegScore). В столбце SynsetTerms представлены термины с номером смысла, принадлежащие к synset (разделенные пробелами).

Я также обнаружил, связанный с этим вопрос здесь, но я не понимаю, особенности чувственного числа от ответа. Вот ссылка связанный с ним вопрос по: What does sentiwordnet 3.0 result signify?

Мой вопрос: Как я могу использовать этот смысл номер часть в моем коде? Что он делает?

ответ

3

Если вы видите lookup "parturient" in WordNet, вы увидите два значения. Это роженицы №1 и роженицы № 2 соответственно.

В этом случае разница довольно тонкая. Но, например, слово "field" has lots of senses, и вам может быть интересно, к какому из них относится.

Вы бы использовали их, если затем начнете смотреть на семантические отношения этого слова. Например. гиперним поля # 4 является «областью знаний», тогда как гиперним поля 1 является «трактом» (участок земли).

Классический пример при рассмотрении настроений - compare suck#2 and suck#4 в контексте разговоров о пылесосе для туалета! Например. «Этот уборщик действительно сосет №4, поскольку он почти не сосет №2».

+0

Благодарим вас за подробный ответ. Теперь для меня это намного яснее. –