В Сверторной нейронной сети Я работаю над обучением CNN, и в процессе обучения, особенно в начале моего обучения, я получаю чрезвычайно высокую ошибку обучения , После этого эта ошибка начинает медленно снижаться. Примерно через 500 Эпохов ошибка обучения приближается к нулю (например, 0,006604). Затем я взял окончательную полученную модель для измерения ее точности по сравнению с данными тестирования, у меня около 89,50%. Это нормально? Я имею в виду получение высокой частоты ошибок при обучении в самом начале моего учебного процесса. Еще одна вещь, которую я хотел бы упомянуть, это то, что я заметил, что каждый раз, когда я уменьшаю количество скрытых узлов, результаты становятся лучше в конце моего обучения.Высокая обучающая ошибка в начале тренировки Сверточная нейронная сеть
Моя структура CNN является:
config.forward_pass_scheme = {'conv_v', 'pool', 'conv_v', 'pool', 'conv_v', 'pool', 'conv_v','full', 'full', 'full', 'out'};
Вот некоторые из моих гипер параметров:
config.learning_rate = 0.01;
config.weight_range = 2;
config.decay = 0.0005;
config.normalize_init_weights = 1;
config.dropout_full_layer = 1;
config.optimization = 'adagrad';
Ваша помощь и предложения в этой связи высоко оценили, спасибо заранее.
Уважаемый Bharat, Спасибо за ваш ответ, Фактически, я делаю то, что после каждой Epoch (полный проход через данные обучения) я оцениваю ошибку обучения, используя партию из набора тренировок. Это то, что вы подразумеваете под набором валидации ?. Еще одна вещь, которую я уже использую, выпадает с помощью метода оптимизации Adagrad. С вашего ответа я понимаю, что это нормально, чтобы получить высокую ошибку обучения в начале. –
Набор валидации отделен от учебного набора. Хотя просмотр ошибки при обучении дает некоторую идею погоды, оптимизация сходится или нет, она не говорит, подходит ли модель для подгонки. Поэтому для измерения производительности модели используется набор валидации (или небольшая часть учебного набора, который не используется для обучения). Да, сразу после первой эпохи ошибка обучения может быть высокой. – Bharat
Нет, в моем случае это отличается. Он начинает высоко, а затем идет очень медленно. Тем не менее, я получаю хорошие результаты на тестовом наборе. Просто, бросая высокую ошибку обучения в начале, меня беспокоит. –