2013-06-19 5 views
0

Я занимаюсь контролируемой классификацией небольших текстов, и данные очень шумные. Я построил кривую обучения: ось х - # экземпляра. y-ось - значение F-меры. Кривая падает: чем больше случаев я использую, тем ниже оценка F-measure. Это типично для шумных данных? Или есть еще одна причина такого поведения?Кривая обучения для шумных данных

+0

Можете ли вы рассказать, как выглядит кривая? – Pedrom

ответ

1

Вы рассчитать F-меру с помощью набора для обучения или набора тестов?

Если вы рассчитали его с помощью тренировочного набора, то падение кривой обучения довольно нормально.

Если вы рассчитали его с помощью набора тестов, то может быть много причин, наиболее вероятно, что тренировочные и тестовые наборы не являются iid.

+0

Я использовал 10-кратное перекрестное подтверждение. – Alina