В настоящее время я делаю опрос в библиотеке машинного обучения с использованием h2o.ai
и SparkMLlib
. Я определил, что большее количество алгоритмов ML поддерживается библиотекой h2o.ai
по сравнению с SparkMLlib
, а разбиение кадра данных Spark на тренировочный и тестовый набор представляется сложным (необходимо преобразовать кадр свечной информации в кадр данных R/h2o, который а также время/ресурс).Разница между h2o.ai и SparkMLlib с точки зрения алгоритма машинного обучения
Каковы другие преимущества/недостатки использования h2o.ai
библиотеки более SparkMLib
или наоборот? Я фокусирую h2o.ai
и SparkMLlib
на реализацию на основе R (SparkR). Таким образом, числовые кадры для h2o (as.h2o)
и SparkMLlib (as.DataFrame)
различны.