2013-06-18 3 views
-1

Я новичок в Big-data и ищу хорошую платформу для выполнения рекомендаций, кластеризации и классификации. Я понимаю, что у Mahout есть много алгоритмов для этого. Также R, являющийся очень хорошим аналитическим инструментом, более чем полезен для достижения этого. Поскольку я смотрю на bigdata, я буду использовать R + hadoop (через потоковое вещание/RHIPE/RHadoop и т. Д.), Если я решит пойти по этому пути. Я ищу сравнение по производительности, масштабируемости, простоте использования, зрелости и т. Д., Учитывая, что разница в сложности используемого языка (Java в mahout и R) для меня сейчас не является фактором.Что лучше для выполнения рекомендаций для кластера Hadoop, Apache Mahout или использования R с Hadoop (через потоки хаопов/RHIPE/RHadoop и т. Д.)?

+0

Если вы хотите использовать Hadoop, что мешает вам использовать Mahout, когда он работает на Hadoop? вы нашли какие-то недостатки? – Swamy

ответ

2

Mahout объединяет множество алгоритмов, и она имеет дело с тремя вопросами (1) Рекомендации (Collaborative алгоритм фильтрации) (2) Кластеризация (3) Классификация

R только для статистики, так что если вы хотите выполните эти три задачи выше, Mahout - отличный инструмент.

BTW, Mahout - проект Maven, поэтому вам нужно установить Maven.