2015-12-02 8 views
0

Я только начал использовать NLTK, и задача, которую мне нужно выполнить, довольно проста, я думаю. Мне нужно разобрать несколько документов и извлечь настроение по отношению к некоторым объектам. Например, общее настроение в следующем предложении:Чувство NLTK к объекту

Tea is great. However, I hate coffee. 

отрицательный, но я хотел бы, чтобы извлечь настроения в отношении отдельных, предопределенные объекты. В частности, в предыдущем примере я хотел бы подавать NLTK своим сущностям ('tea', 'coffee') и иметь возможность извлекать sentiment('tea') и sentiment('coffee') отдельно. Я прочитал документ this, но не смог найти способ выполнить эту простую задачу.

+0

Ваш пример включает два предложения, а не один, а анализ настроений - открытая область исследований, особенно если вы надеетесь извлечь настроения на уровне целых документов. – dmh

+0

@ dmh, почему так пессимистично? Общие методы анализа чувств настолько грубые, что на самом деле не имеет значения, применяете ли вы их к предложению или к тексту. Например, нет синтаксического анализа - это в основном классификация слов. – alexis

+0

Предполагаю, что я предположил, что @Simone искал более подходящий подход, не спросив, действительно ли базовая линия с мешком слов будет достаточно хороша для их применения. Извините, если мой комментарий был обескураживающим и бесполезным, @Simone! – dmh

ответ

1

Вам понадобится classifier, и вам понадобится аннотированный корпус настроения для его обучения. Nltk предлагает корпус movie_review, но, конечно, вы получите лучшие результаты, если будете тренироваться с чем-то похожим на свои собственные данные. См. Также пакет nltk nltk.sentiment.

+0

Большое спасибо за указатели (и «оптимизм» (;)! Я, вероятно, последую за дополнительными вопросами во время погружения в эту структуру! –