2010-11-15 2 views
13

Мне было интересно, знают ли кто-нибудь о каких-либо хороших модулях Perl и/или Java-классах для анализа настроений. Я читал о LingPipe, но в конечном итоге программа должна быть использована для коммерческого использования, поэтому что-то с открытым исходным кодом было бы лучше. Я также посмотрел в GATE, но их документация по анализу настроений в лучшем случае разрежена.Анализ настроений в Perl или Java

ответ

7

Посмотрите на Rate_Sentiment в модуле WebService::GoogleHack на CPAN. Более подробную информацию о проекте можно получить по адресу SourceForge.

+1

Я видел это, но у него нет оценок, и я беспокоился о масштабируемости, поскольку он упоминает использование API Google. У вас есть какой-либо опыт в этом? – user387049

+0

Нет, я никогда не использовал его. Тем не менее, [Тед Педерсен] (http://www.d.umn.edu/~tpederse/), по-видимому, является одним из авторов. Он [довольно крупная фигура] (http://search.cpan.org/~tpederse/) в Perl NLP. –

3

Я просто добавил библиотеку анализа настроений в свой Инструмент исследований социальных медиа Analytics. Сообщение/объявление в блоге here. Он находится в R, а не на Java, но есть хороший интерфейс между R и Java в наборе инструментов, поэтому вы можете написать свой «код клея» в Java, чтобы вызвать библиотеку R. В наборе инструментов также есть интерфейс R - Python.

Должен быть интерфейс R/Perl, но я не смог связаться с сопровождающим о ошибках, поэтому я взял его из сборки.

0

Вы можете взглянуть на LingPipe (Java) анализ настроений, основанный на:

http://alias-i.com/lingpipe/demos/tutorial/sentiment/read-me.html

и GATE (http://gate.ac.uk/sentiment/)

Для более обобщенных парсеров NLP см. Парсер Стэнфорда (http://nlp.stanford.edu/software/lex-parser.shtml), NLTK (Python) (http://www.nltk.org/) и т. Д.

Мне не известны какие-либо подобные инструменты с открытым исходным кодом для Perl, хотя есть некоторые хорошие базовые ссылки, чтобы вы начали, например:

Billisoly, R. (2008) Практическая обработка текста с помощью Perl. Wiley. ISBN 978-0-470-17643-6.