2

Когда вы используете Haar-подобные функции для ваших данных обучения для алгоритма Adaboost, как вы строите свои наборы данных? Вам буквально приходится находить тысячи положительных и отрицательных образцов? Должен быть более эффективный способ сделать это ...Машинное обучение - шаг обучения

Я пытаюсь проанализировать изображения в matlab (не лица) и относительно новичок в обработке изображений.

+1

попробуйте добавить теги 'machine-learning' и' image-processing' – Geoff

ответ

4

Да, вам нужно много положительных и отрицательных образцов для обучения. Это особенно верно для Adaboost, который работает, повторно передискретируя набор тренировок. Сколько проб достаточно, трудно сказать. Но в целом, чем больше, тем лучше, потому что это увеличивает шансы вашего тренировочного набора быть репрезентативным.

Кроме того, мне кажется, что ваш поиск эффективности неуместен. Обучение проводится заранее, предположительно в автономном режиме. Эффективность классификации неизвестных экземпляров после тренировки делается, о чем обычно беспокоят люди.

0

Несомненно, больше данных, больше информации, лучшего результата. Вы должны включить более подробную информацию. Однако, одна вещь, вам может потребоваться помощь, это отношение положительного набора к отрицательному набору. Для логистической регрессии отношение не должно превышать 1: 5, для adaboost я не уверен в результате, но он, безусловно, изменится с коэффициентом (я пробовал раньше).

0

Да, нам нужно много положительных и отрицательных образцов для обучения, но сбор этих данных очень утомительный. Но вы можете сделать это легко, взяв видео вместо изображений и используя ffmpeg для преобразования этих видео в изображения. Это значительно облегчит учебную часть.

0

Единственная причина иметь одинаковые положительные и отрицательные образцы - избежать смещения. Иногда вы можете получить высокую точность, но полностью не классифицировать одну категорию. Для оценки таких методов точность/отзыв более полезны, чем точность.