3

У меня возникла проблема с выбором правильного классификатора для моей задачи по добыче данных.Помогите мне выбрать правильный classifer

Я помещаю веб-страницы, используя статистический метод, и маркирую их с использованием шкалы 1-4, 1 из которых является самым бедным, а 4 - лучшим.

Раньше я использовал SVM для обучения системы, так как тогда я использовал двоичную метку (1,0). Но теперь, когда я переключаюсь на эту метку 4-класса, мне нужно изменить классификатор, потому что я думаю, что SVM классификатор будет работать только для классификации из двух классов (пожалуйста, поправьте меня, если я ошибаюсь).

Не могли бы вы предложить некоторые предложения здесь о том, какой классификатор является наиболее подходящим здесь для моей цели классификации.

Заранее благодарим за предложения.

ответ

6

Существует несколько классов SVM. LibSVM имеет реализацию, как и Weka.

Обычно лучше экспериментировать с несколькими классификаторами, чтобы узнать, какой из них лучше всего работает с вашими данными. Выбор типа классификатора и алгоритма обучения далеко менее важны, чем ваш выбор набора функций. Вы можете попробовать наивные байесовские, мульти-классные SVM, MaxEnt, проголосовали за персептроны или за любую вашу библиотеку.

+0

Спасибо! Вы знаете, как включить многоуровневый SVM в Weka, пожалуйста? Я играл с ним некоторое время, но он работал только для двоичных классов. – Kevin

+0

Я сам не использую Weka, но, видимо, вам нужен либо класс 'weka.classifiers.functions.SMO', либо отдельный плагин WLSVM (http://www.cs.iastate.edu/~yasser/wlsvm/) –

+0

Я хотел бы знать, какие доказательства этого утверждения относительно относительной важности набора функций и типа алгоритма. Я просто столкнулся с примером, когда переход от наивных baies к SVM имел большое значение. Набор функций был точно таким же. И если вы слушаете Norvig от Google, не имеет значения, только размер набора для тренировок. – piccolbo

2

Вы говорите об «порядковой классификации». Это можно сделать модифицированным using SVM (как уже упоминалось, оно также реализовано в libSVM), используя logistic regression и даже using decision trees или искусственные нейронные сети.

Вы даже можете продолжать использовать свои метки, выполнять регрессионный анализ по вашему выбору, а затем дешифровать результат. Большинство методов, о которых я упомянул выше, делают это за кулисами.

Успехов

1

Вы могли бы попытаться проверить Эндрю NG Лекция о том, как выбрать алгоритм ML, который лучше всего подходит вам, я думаю, что это довольно поучительно, и это может дать вам некоторое представление о том, как управлять своими данными