Я пытаюсь сделать классификацию с помощью искромера, особенно используя RandomForestModel.Спаркс-mllib переучивание сохраненных моделей
Я рассмотрел этот пример из искры (RandomForestClassificationExample.scala), но мне нужен несколько расширенный подход.
Мне нужно уметь обучать модель, сохранять модель для будущего использования, но также иметь возможность загрузить ее и продолжить поездку. Например, расширьте набор данных и снова поезжайте.
Чтобы добавить, единственное, что может иметь смысл, - использовать ранее подготовленные параметры модели в качестве отправной точки при обучении модели новым/расширенным набором данных. Тем не менее, вы также должны запустить модель с состоянием _clean slate_ для параметров, чтобы проверить, не переусердствуете ли вы. Таким образом, я согласен с eliasah, что _retraining_ имеет мало смысла. – TDrabas
Учитывая, что онлайн-обучение - большое поле - почему дальнейшая подготовка не имеет смысла? Конечно, не кажется неуместным, по крайней мере, поддерживать базовые SGD, когда это возможно ...? – user31415