2016-08-29 7 views
7

Я следил за this ссылка на использование текстов. Я обучил модель, используя предоставленную команду. Но я не вижу папки «train» в каталоге «textum/log_root /». Поскольку обучение проводится по образцу файла, сможет ли модель работать с данными в режиме реального времени? Если нет, то как я могу сделать учебные данные и обучить модель? И самое главное, как я могу проверить/использовать модель, чтобы увидеть результат?Как пользоваться текстом?

ответ

2

Я честно не могу ответить, почему вы не увидели папку с поездом в каталоге log_root, если вы правильно передали все свои параметры. Еще одно замечание - убедиться, что вы достаточно долго ждали. Поэтому, когда вы выполняете свой тренировочный прогон с использованием Textsum, вы видите какие-то подробные журналы, в которых указывается некоторая ошибка, например, нет списка файлов или чего-то еще. Если это так, то ваш путь, передаваемый одному из параметров, вероятно, выключен. Это относится к тому пути, из которого вы его вызываете, поэтому вам нужно убедиться, что вы находитесь на корневом пути, где находится ваш файл рабочей области.

Другое дело, используете ли вы процессор или графический процессор? Если вы используете CPU ... для модели требуется некоторое время, чтобы добраться до точки, где она даже может записывать данные. Теперь, если вы используете GPU, это намного быстрее, но вам нужно подождать, пока вы не увидите, что журналы «average_loss» начинают печатать на вашем экране. Как только вы их заметите, тогда есть хорошая вероятность, что вы увидите свою папку «поезд» с данными.

Что касается тестовых данных «в реальном времени», я все еще смотрю в это сам, и теперь, когда у меня есть мои текущие данные, прошедшие подготовку по модели, я тоже начну с этого. Направление, которое я понимаю до сих пор, заключается в том, что, как только вы подготовили свою модель и имеете свой файл рассола или что-нибудь в этом роде, вы можете «обслуживать» его, используя информацию здесь: https://tensorflow.github.io/serving/

В этот момент ваша модель обучена , и вы можете запросить его и подать новый ответ, чтобы со временем ваша модель стала более умной. Опять же, я еще не доказал этого с примером, но это тот подход, который я собираюсь начать здесь в ближайшее время.

Что касается «тестирования модели», вы в значительной степени можете следовать инструкциям, представленным на textum git, перегенерировать файл vocab, а затем тренироваться. Затем, после того как вы получите среднюю потерю до достаточно небольшой доли, вы можете запустить декодирование данных. Затем в вашей папке декодирования log_root вы увидите созданные заголовки и связанные с ними файлы ссылок (каков был фактический заголовок). Надеюсь, что это помогает и удачи!

+0

Привет, xtreeme, я обучил свою модель более 1 миллиона записей, но она не генерирует декодированное резюме и ссылку на файл ссылки. – Wazzzy

+0

Эй, @Wazzzy ... качество очень основано на чистоте данных, которые вы использовали для обучения. Поскольку это абстрактная модель, вы также не получите точное соответствие, поскольку модель буквально генерирует что-то самостоятельно на основе данных, которые она была обучена, поэтому вам нужен такой большой набор данных. При этом результаты должны быть близкими. Если это не так, вы можете посмотреть данные, которые вы подавали, и попытаться их очистить. Вы можете легко сказать, насколько хороши ваши данные, просматривая файл вокала и видя, что там находится. – xtr33me