2016-11-16 4 views
1

Я использую Tensorflow 0.9 и тренируюсь с помощью модели Textsum. У меня около 1,3 миллиона статей, которые я выскочил и тренировался против них уже около недели. Средний убыток составил около 1,75 - 2,1. Я решил остановиться и запустить eval, поскольку я понимаю, что моя средняя потеря должна быть близка к тому, что я получаю с обучением. Когда я побежал на eval, я вижу среднюю потерю 2,6-2,9. Я просто задавался вопросом, что я должен ожидать, когда вы будете выполнять этот прогон.Как определить, переписывает ли обучение textum?

Я правильно использую этот анализ обучения/анализа? Я несколько новичок в глубоком обучении и стараюсь использовать это как способ обучения и через какое-то другое чтение, кажется, что это может быть немного большим распространением между ними.

Существует ли стандартный перенос для оценки другого набора данных и какова разница между средними потерями? На данный момент я не уверен, должен ли я продолжать тренироваться или останавливаться здесь на данный момент и попытаться выяснить, как это работает в приложении tensorflow. Я не хочу переоценивать модель, но с академической точки зрения, допустим, я тренировался по-разному. Что мне нужно сделать, чтобы «исправить» его? Вы просто получаете больше статей и загружаете эти данные сейчас в качестве обучения или модель по существу сломана и непригодна для использования?

ответ

0

Нет гарантии, что потери в результате будут соответствовать потерям в тренировках. Переобучение трудно измерить, но если убыток eval увеличивается по мере прохождения обучения, это явный признак этого.