2016-11-17 13 views
1

Работаю над текссумской моделью тензорного потока, которая представляет собой обобщение текста. Я выполнял команды, указанные в readme, по адресу github/textsum. Он сказал, что файл с именем validation, присутствующий в папке с данными, должен использоваться на шаге eval, но в папке с данными не было файла проверки.Какой файл будет использоваться для шага eval в TEXTSUM?

Я думал, что сделал сам, а потом понял, что это должен быть двоичный файл. Поэтому мне нужно было подготовить текстовый файл, который будет преобразован в двоичный. Но этот текстовый файл должен иметь определенный формат. Будет ли он таким же, как у файла, используемого на подиуме? Могу ли я использовать тот же файл для шага поезда и шага eval? Последовательность шагов я последовал являются:

Шаг 1: Поезд модели с помощью файла Vocab, который был упомянут как «обновленный» для игрушечного набора данных

Шаг 2: Обучение продолжалось некоторое время, и он получил " Killed "at running_avg_loss: 3.590769

Шаг 3: Используя те же данные и словарные файлы для шага eval, как и для обучения, я побежал eval. Он продолжает работать с run_avg_loss между 6 и 7

Я сомневаюсь в шаге 3, если такие же файлы будут использоваться или нет.

+1

Могу ли я узнать, почему это было отклонено, так что я могу устранить проблемы в этом вопросе! – Ayushya

ответ

1

Таким образом, вам не нужно запускать eval, если вы на самом деле не тестируете свою модель после того, как научились определять, как тренируется против другого набора данных, который он никогда раньше не видел. Я также петь его, чтобы определить, начинаю ли я перерабатывать данные.

Таким образом, вы обычно берете 20-30% вашего общего набора данных и используете его для процесса eval. Затем вы проводите тренировку против своих данных обучения. После завершения вы можете просто запустить декодирование сразу, если хотите, или вы можете запустить eval против 20% - 30% набора данных, который вы отложили в начале. Как только вы почувствуете себя комфортно с результатами, вы сможете запустить декодирование, чтобы получить результаты.

Ваш двоичный формат должен быть таким же, как и ваши данные обучения.

 Смежные вопросы

  • Нет связанных вопросов^_^