2011-12-18 6 views
5

Мне нужна помощь по весовому варианту libSVM. Я в какой-то момент смущен; следует ли использовать параметр -wi при перекрестной проверке? Если это так, следует ли использовать рассчитанные веса всех данных или рассчитанных весов в соответствии с подмножествами v-1 (для v-кратной перекрестной проверки)? И мой второй вопрос заключается в том, следует ли использовать опцию -wi во время прогнозирования? Если да, следует ли использовать расчетные веса во время обучения или мы должны рассчитать весы в соответствии с распределением отрицательных и положительных экземпляров в тестовых данных?LibSVM: опция -wi (выбор веса) при перекрестной проверке и тестировании

Например, у нас есть 50 + данных и 200 - данных. Поэтому после вычисления наилучших значений параметра c и гамма мы будем использовать -w1 4 -w-1 1 опции во время обучения. Но как насчет обучения во время поиска сетки и перекрестной проверки? Допустим, мы выполняем пятикратную перекрестную проверку. Во время обучения по каждому оставшемуся 4 подмножествам распределение отрицательных и вероятных экземпляров, вероятно, изменится. Итак, следует ли пересчитать весы во время этой 5-кратной проверки креста?

Помимо shoud мы используем -w1 4 -w-1 1 опции во время тестирования?

Благодаря

ответ

6

Чтобы ответить на первый вопрос, если вы подаете нетривиальные веса к подмножеству классов в процессе обучения модели, то вы должны сделать то же самое на протяжении всего обучения/настройки, которая включает в себя настройку на основе кросс-проверки от C и гамма (в противном случае вы бы настроили модель на основе чувствительной к стоимости задачи/функции риска/потери, которая отличается от той, которую вы действительно указываете, включив нетривиальные веса классов)

Вес класса внешние по отношению к libSVM в том смысле, что они не вычисляются libSVM - эта опция командной строки позволяет пользователю устанавливать собственные весы класса, чтобы подчеркнуть/уменьшить важность подмножества классов. Некоторые люди настраивают классные веса, но это совсем другая история.

Что касается предсказания, то весовые коэффициенты класса не используются там явно (поскольку они входят в «настройку» функции «цель/риск/потеря» во время этапа обучения/настройки модели, поэтому полученная модель уже «осознает» "весов")