2015-01-17 5 views
-1

Я собираюсь получить некоторые данные обзора от tripadvisor, и я хочу, чтобы иметь возможность извлекать связанные с отелем аспекты и назначать им полярность и классифицировать их как отрицательные или позитивные.Какие хорошие инструменты/практики для анализа настроения на уровне аспект?

Какие инструменты я могу использовать для этой цели и как и с чего начать? Я знаю, что есть такие инструменты, как GATE, Stanford NLP, Open NLP и т. Д., Но могу ли я выполнить вышеупомянутые конкретные задачи? Если это так, пожалуйста, дайте мне знать, как идти вперед. Я планирую использовать Java как выбор языка программирования и хотел бы использовать некоторые API.

Кроме того, следует ли я использовать подход, основанный на правилах, или подход ML, в котором используется обученный корпус отзывов, поэтому некоторый другой подход полностью?

P.S: Я новичок в НЛП, и мне нужна помощь, чтобы идти вперед.

ответ

0

Stanford CoreNLP имеет много возможностей в одном пакете

  • POS Tagger
  • ЧПО Модель
  • Настроения Анализ
  • Parser

Но в Apache пакет OpenNLP состоит

  • Приговор Detector
  • POS Таггер
  • ЧПО
  • Chunker

Но они не имеют встроенные функции, чтобы узнать, Sentiment полярность Таким образом, вы должны передать свои метки в другие библиотеки, такие как SentiwordNet, чтобы узнать полярность.

б/у OpenNLP и Stanford Core NLP. Но для обоих вам нужно изменить тело настроения по отношению к домену ресторана.

+0

Действительно ли необходимо иметь корпус? Существуют ли другие оценки? простите мое невежество. Я новичок во всех этих понятиях –

+0

Возможно, вам нужно будет создать собственный корпус, если вы не найдете что-то очень похожее на ваш конкретный текстовый домен (отзывы об отелях). Вы можете сделать это автоматически, сохранив сопоставления рейтинга обзора. –