2015-07-02 2 views
2

Моим приложениям нужны функции анализа настроений. Я нашел множество служб и библиотек, которые могут помочь в решении этой задачи. Но большинство из них имеют «трехмерный» вывод: текст может быть классифицирован как «позитивный», «отрицательный» или «нейтральный».Анализ настроений: более 3-х сенсоров

Но что, если мне нужно больше вариантов? Например: «уверенно/сомнительно» »,„спокойный/насторожило“,„вид/агрессивный“или что-то в этом роде.

ли вообще возможно выполнить такую ​​классификацию? может быть, есть уже некоторые услуги/структуры/библиотеки доступны?

+0

Если вам нужен более мелкозернистый анализ, вам может потребоваться некоторое машинное обучение и обучить ваш анализатор, чтобы узнать, что вещи «уверенно/сомнительно» и т. Д. –

+0

ОК: существуют ли какие-либо поезда или корпуса для таких вид машинного обучения? –

+0

Я довольно новичок в этой области в целом, поэтому я не могу сказать окончательно. Вы можете попробовать посмотреть, но если это ваши собственные классификации, вам придется самостоятельно обучать их. –

ответ

0

Вы должны попробовать WordNet-Affect. Этот ресурс дает дерево эмоций. Поскольку это довольно старый ressource, вам придется вручную разобрать его и сопоставить идентификаторы с помощью WordNet 1.6 synsets (я сделал это в Python here).

+0

Выглядит отлично, спасибо! –

0

Вы можете (https://en.wikipedia.org/wiki/Support_vector_machine) для анализа настроений.

Поддержка: Vector Machine - контролируемый алгоритм, поэтому вам нужно обучать алгоритм данными, ранее классифицированными (уверенными, сомнительными, спокойными, предупрежденными, добрыми, агрессивными). Наконец, вы получите модель, которую вы можете использовать для классификации нового текста.

Я использовал библиотеку LibSVM с phyton (https://www.csie.ntu.edu.tw/~cjlin/libsvm/) с хорошими результатами. Я думаю, вы также можете использовать его с java.

+0

Любые идеи, где я могу получить соответствующий набор упражнений? –

+0

Трудно найти набор для обучения, соответствующий вашим потребностям. Я использовал этот набор данных: http://www.cs.cornell.edu/people/pabo/movie-review-data/ (моя цель заключалась в анализе настроений относительно фильмов). Другой вариант - классифицировать данные вручную. – Walter