2015-01-17 7 views
1

Стоимость SVM e1071 не кажется такой же, как стоимость svmlight. В руководстве e1071 состояний библиотеки следующее определение для его параметра Стоимость:Как обеспечить стоимость для балансировки обучения с помощью несбалансированного набора данных поезда, доступного в svmlight?

cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular- 
ization term in the Lagrange formulation 

Это в основном пособие промаха-классификации. Существует один вес, как это предусмотрено svmlight, описанные в руководстве, так как:

Cost: cost-factor, by which training errors on 
     positive examples outweight errors on negative 
     examples (default 1) 

Эта стоимость в основном, чтобы балансировать в случае данные поезда не имеет одинаковое количество положительных и отрицательных точек данных. Есть ли что-то подобное в реализации SVM в e1071?

ответ

0

Возможно, вы захотите рассмотреть аргумент: class.weights (что объясняется на странице справки).

Лучший Дэвид

+0

Эй, спасибо Дэвид! Я думаю, вы тот же Дэвид Майер, автор и сопровождающий e1071. Я действительно удивляюсь, кто (и почему) отказался от вашего ответа - это именно то, о чем я просил. Я тоже уверен, что предыдущий downvote будет аннулирован. Еще раз спасибо! и Добро пожаловать в Stackoverflow. –