2016-10-23 11 views
1

Я работаю над проектом анализа настроений, в котором используется лексика SentiwordNet3. Проблема в том, что я не могу понять структуру лексики. Одна линия этого лексиконе:Внутренняя структура SentiWordNet 3

00002730 0 0 acroscopiC# 1 облицовочный или на стороне по направлению к вершине

1.a =? Назначение: a?

2.POS-ID=00002730. Какова цель POS-ID?

3.SynsetTerms Gloss = acroscopic#1 facing or on the side toward the apex

  1. Что такое acroscopic? Разве это слово, что мы хотим получить оценку?
  2. Что такое #1? Цель?
  3. Почему предложение после #1? facing or on the side toward the apex.

Насколько получающего доступ нот, то мы обращались как

`list(SWN.senti_synsets(Tagged[i][0],'a')` 

a является Adjectivev тогда, r и n также в лексиконе.

ответ

0

Корпус имеет заголовок, содержащий определение столбцов:

POS ID PosScore NegScore SynsetTerms Gloss

  1. POS 'а' это часть речи (прилагательное)
  2. ID является уникальный идентификатор леммы Wordnet
  3. PosScore => положительная оценка
  4. NegScore => отрицательный оценка
  5. SynsetTerms => Wordnet synset имена (# 1 = первый смысл, # 2 = второй смысл)
  6. Пояснительная предложение
+0

Таким образом, если мы дадим 'список (SWN.senti_synsets (Tagged [я] [0 ], 'a'), какой смысл будет возвращаться? Как определить смысл? – Amar

+0

Ну, это вернет все чувства. Он вернет список синхронизаций, содержащих список лемм. Вот пример: http://www.nltk.org/howto/sentiwordnet.html Вот как делается сопоставление между WN и SWN: https://github.com/bogdan-ivanov/wnext/blob/master/sentiwordnet. ру – bogs

+0

Это 'от nltk.corpus импорта sentiwordnet как SWN счастливого = swn.senti_synsets ('счастливого', 'а') ибо я в счастливом: печати (я)' 'возвращает '' '' '' '' glad.s.02' и почему '02' здесь? – Amar