2015-03-13 1 views
0

В поисках алгоритма для проблемы классификации твитов, я пересек с SVM. Начиная с LibSVM, я реализовал систему, использующую его java-библиотеку (а не командную строку), которая получается с 50% -60% с линейной функцией. Теперь я хочу выполнить выбор модели, масштабирование, перекрестную проверку и выбор функций в надежде улучшить мою точность. Проблема в том, что я не мог найти эти функции в библиотеке Java по адресу LibSVM. Итак, какие у меня варианты. учитывая, что я программист на Java? И если вариант состоит в том, чтобы написать их сам, как и с каким альго? Должен ли я пойти с какой-либо другой машинной библиотекой обучения или algo для выполнения этой задачи?Как выполнить выбор модели с помощью LibSVM с помощью библиотеки Java?

ответ

0

Процесс выбора модели в SVM, который помогает вам выбрать лучшую модель, основанную на различных параметрах функции. В библиотеке LibSVM выбор модели выполняется с использованием метода перекрестной проверки. То, что он делает, разбивает ваши данные обучения на несколько подмножеств и каждый раз готовит модель с различными параметрами с каждым данным для повышения точности. это также устраняет over fitting problem.

0

Я не уверен, что вы подразумеваете под выбором модели или масштабированием. Я знаю, что LibSVM перекрестно проверяет, но я не знаю о выборе функции. Я рекомендую использовать R вместо java. Есть много пакетов для различных методов отбора признаков, а также SVM нравится:

e1071

+0

Спасибо VTT, перекрестная проверка на самом деле является выбором модели. И я буду рассматривать R, но мне интересно, можем ли мы использовать его в реальных проектах уровня производства с непрерывными текущими данными. –

0

JSAT имеет реализацию SVM (не точно такой же алгоритм, используемый LibSVM, но решает ту же проблему), а также как и многие другие алгоритмы, GridSearch и методы выбора объектов.

примечание об уклонении: я являюсь автором библиотеки.

+0

Спасибо, сэр, я пройду через JSAT, и если я нахожу это подходящим, я сообщу вам. Может быть, вы можете дать мне несколько советов о написании моего собственного проекта выбора модели на основе ABC или генетического альго. –

+0

Генетические алгоритмы в основном полезны только тогда, когда у нас нет хорошего способа поиска в пространстве. Для параметра running Grid Search отлично, и Random search работает хорошо, у вас слишком много параметров. –