2016-07-13 8 views
0

Я никогда не видел таких кривых обучения. Правильно ли, что происходит огромное переобучение? Модель подходит лучше и лучше для данных обучения, в то время как она еще хуже ухудшает данные теста.Высокая предвзятость или отклонение? - SVM и прочерченные кривые обучения

Обычно, когда существует высокая дисперсия, как здесь, больше примеров должны помочь. В этом случае они не будут, я подозреваю. Почему это? Почему такой пример кривых обучения не может быть легко найден в литературе/учебниках?

Learning curves. SVM, param1 is C, param2 is gamma

ответ

1

Вы должны помнить, что СВМ не модель параметрической, таким образом, больше образцов не должны уменьшить дисперсию. Уменьшение дисперсии может быть более или менее гарантировано для параметрической модели (например, нейронной сети), но SVM не является одним из них - больше образцов означает не только лучшие данные по обучению, но и более сложную модель. Кривые обучения являются типичным примером перепрофилирования SVM, что очень часто происходит с ядром RBF.

+0

Благодарим вас за ответ. У меня недостаточно опыта с непараметрической моделью, поэтому я не думал об этом. Можете ли вы сказать мне, что, если у меня будет подобный сюжет, но кривая валидации будет повышаться, как и кривая обучения? Для меня важно, что тренировочный набор постоянно растет. Разрыв между кривыми по-прежнему большой, скажем, постоянный. Могу ли я предположить, что ничего не изменилось, модель все еще переоценивает? – DavidS1992