0

Я хотел бы сделать анализ настроений на уровне документа. Но я пытаюсь сделать анализ настроений Непала. Итак, у меня нет ресурсов. Я не могу использовать классификатор Naive Bayes, так как у меня нет никаких помеченных данных, и я не могу использовать vai wordnet, так как нет nepali wordnet. Документы, которые я читал, обычно обозначали данные или senti-wordnet для других языков.Анализ настроений для местных языков (непальский)

Я хотел бы знать эти вещи:

  • Какой подход следует использовать в описанном выше случае для анализа настроений?
  • Есть ли способ для меня динамически генерировать метки для данных?
+0

Одним из важнейших компонентов в классификации классификации является данные. Я понятия не имею, где получить непальские данные, но вы должны приложить свои усилия для его поиска. Позже, когда у вас будут данные, методы в основном одинаковы, вы каким-либо образом преобразуете свои функции (слова) в целые числа, чтобы это не имело значения. Просто найдите учебный комплект. –

ответ

2

Поскольку у вас нет данных о пометке, ознакомьтесь с this GitHub Repo, не стесняясь вилки.

У этого есть код для нейронной сети для распознавания рукописного ввода в Java. Джефф Хитон сделал это легко для нас, с приятным интерфейсом, вы можете обучить эту модель распознавать непальский.

И для анализа настроений вы можете попробовать использовать Opennlp, который имеет хорошую поддержку, this blog for Beginner's.

Также DL4J - хорошая библиотека для глубокого изучения Java, которая может использоваться для анализа настроений. Он имеет хорошую реализацию Word2Vector и имеет большую поддержку.

Эти ресурсы помогут вам, любые сомнения, не стесняйтесь комментировать.