2015-06-06 5 views
0

Я пытаюсь классифицировать различные понятия в тексте с помощью n-грамма. Мой данные tyically существует из шести колонок:Полиномиальная ошибка в Rapidminer при n-грамматической классификации

  1. Слова, которое нуждается в классификационном
  2. Классификационного
  3. Первого слова слева от 1)
  4. Второго слова слева от 1)
  5. Первого слово о праве 1)
  6. второго слова справа 1)

Когда я попробуйте использовать SVM в Rapidminer, я получаю ошибку, что он не может обрабатывать полиномиальные значения. Я знаю, что это можно сделать, потому что я прочитал его в разных документах. Я установил второй столбец на «метку» и попытался настроить остальные на «текст» или «реальный», но, похоже, это не имеет никакого эффекта. Что я делаю не так?

ответ

0

Вы должны использовать Оператор Support Vector Machine (LibSVM). В отличие от классического SVM, который поддерживает только две проблемы класса, реализация LibSVM (http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf) поддерживает классификацию нескольких классов, а также регрессию.

0

Одним из подходов может быть создание атрибутов с именами, равными словам и значениям, равным расстоянию от слова интереса. Конечно, все возможные слова должны быть представлены как атрибуты, поэтому входные данные будут большими.