Я тренирую CNN в Caffe, выход которого является либо одним из двух классов (двоичная проблема).Caffe: классы балансировки внутри пакета с слоем ImageData
Я использую слой ImageData в качестве входного слоя, передавая два .txt с набором для обучения и проверки. Эти файлы сбалансированы, i.e., количество примеров одинаково для обоих классов. В этом слое я также использую параметр «shuffle».
По этому поводу у меня есть два сомнения:
1. Как партия оцифровывается/выбирается из .txt файлов?
построен ли он, получив первые N примеров (скажем, N является размером партии) файла, перетасовки их и кормить их к сети? В этом смысле сама партия не может быть сбалансирована. Это влияет на обучение/точную настройку?
Другим способом будет случайным образом образца N/2 примеров из одного класса и N/2 от других, но я не думаю, что Caffe делает это.
2. Порядок примеров в .txt-файлах заключается в том, как устроена партия?
Было бы неплохо создать файл .txt так, чтобы партия была сбалансирована (например, каждая нечетная строка имеет один класс, а каждый четный - другой)?
Благодарим за помощь!
Полезно знать, @Prune! Большое спасибо за ваш ответ! – rafaspadilha
Рад помочь. Спасибо, что приняли ответ - это помогает СО правильно архивировать вопрос. – Prune