Я попытался использовать явную функцию поезда для рекомендации продуктов на основе пользовательских настроек (производных настроек) и MSE для этого достаточно хорош для набора учебных и тестовых данных. (Лямбда = 0,01)Spark mllib: Разница между implicitTrain и explicitTrain
Те же самые данные, когда я использую в trainImplicit СКО увеличивается до 20 раз для обоих тест и обучающего набора данных. (Лямбда = 0,01, альфа = 1,0)
Теперь я понимаю, что они отличаются algos, но как я могу судить, если неявное работает лучше, чем явное или нет?
Каковы ваши оценки для явных? Я спрашиваю, потому что если вы не нормализуетесь и, например, у вас есть рейтинги от 1 до 5, ваша квадратная ошибка для заданных оценок будет находиться между 0 и 16. Если с неявной обратной связью она будет между 0 и 1. –
также, как вы переходите от явного к неявному? для меня, с явным, для каждого пользователя у вас много неизвестного (продукт, который они не оценили), тогда рейтинги для некоторого продукта (даже если рейтинги 0-1). Принимая во внимание, что у вас много 0 и пара 1 –