2016-11-07 7 views
1

У меня есть вопрос, связанный с этим один:TensorFlow в производстве: Как переучить свои модели

TensorFlow in production for real time predictions in high traffic app - how to use?

Я хочу, чтобы настроить TensorFlow сервировки сделать вывод как услуга для нашего другого приложения. Я вижу, как TensorFlow Service помогает мне это делать. Кроме того, в нем упоминается continuous training pipeline, что, вероятно, связано с возможностью обслуживания TensorFlow Service с несколькими версиями обучаемой модели. Но я не уверен, как переучивать вашу модель, когда вы получаете новые данные. В другом сообщении упоминается идея переподготовки с заданиями cron. Однако я не уверен, что автоматическая переподготовка - хорошая идея. Какую архитектуру вы бы предложили для непрерывного переподготовки трубопровода с системой, постоянно сталкивающейся с новыми, помеченными данными?

Редактировать: Это контролируемый учебный случай. Вопрос в том, будет ли вы автоматически переучивать свою модель после того, как в нее войдут n новых точек данных, или вы переучитесь во время простоя клиента автоматически или просто переучитесь вручную?

ответ

1

Возможно, вы захотите использовать какое-то полуподконтрольное обучение. В этой области есть довольно обширные исследования.

Грубый, но целесообразный способ, который хорошо работает, заключается в использовании современных лучших моделей, которые вы должны маркировать новыми входящими данными. Модели, как правило, могут производить оценку (надеюсь, logprob). Вы можете использовать этот балл, чтобы тренировать только данные, которые подходят хорошо.

Это подход, который мы использовали для распознавания речи и является отличной базой.

+0

Спасибо за ответ, это звучит неплохо для других задач, которые у нас есть. На самом деле меня больше интересовало, как вы меняете свою новую модель с новой моделью в контролируемом, непрерывном процессе переобучения. Смысл, если у вас есть модель x, и вы видите n новых, помеченных datapoints, когда вы переучиваете, чтобы улучшить свою модель до x + 1? Вы даже активируете число точек данных или можете ли вы повторно запустить его во время простоя клиента, если это возможно? Или вы только перезагрузите вручную, а не автоматически? – Ben

+1

Существует два подхода, оба используются по разным причинам. Они требуют определенного уровня масштаба. В первом мы имеем команду ученых-данных, постоянно совершенствуем алгоритмы и используем больше данных. Затем каждую неделю они встречаются для запуска комитета. Каждое усовершенствование, которое идет на алгоритм, должно быть одобрено. В другом подходе, механически, каждый, скажем, в среду, ветвь разрезается с помощью моделей. Затем его подталкивают все, что находится на голове. В обоих случаях мы включаем новую модель/код в сервисную службу и отслеживаем ее за время ожидания, память, точность и т. Д. – drpng

 Смежные вопросы

  • Нет связанных вопросов^_^