1

В какой-то день мы используем искру мл, чтобы построить модель из существующих данных, позже мы получаем больше данных, поступающих каждый день. Есть ли способ, по которому мы можем только читать новые данные и обновлять существующую модель, не перечитывая все данные каждый раз?Можем ли мы обновить существующую модель в искровом мл?

Благодаря ...

ответ

0

Чтобы выполнить ответ Флорента, если вы не находитесь в потоковом контексте, некоторые модели Spark mllib поддерживают initialModel в качестве отправной точки для инкрементных обновлений. См., Например, KMeans, или GMM.