Я использую библиотеку boto для создания потока работы в Amazons Elastic MapReduce Webservice (EMR). Следующий код должен создать шаг: step2 = JarStep(name='Find similiar items',
jar='s3n://rec
Приведенные данные в следующем формате (tag_uri image_uri image_uri image_uri ...), мне нужно, чтобы превратить их в формат Hadoop SequenceFile для дальнейшей обработки Mahout (например кластеризация)
Я пытаюсь создать систему Рекомендаций, основанных на совместном использовании фильтров, в рамках академического проекта. Я думаю, что проект Mahout имеет большой потенциал, и я хочу его использовать.
Я пытаюсь решить простую задачу классификации. Проблема: У меня есть набор текстов, и я должен классифицировать их по содержанию. Решение с использованием Mahout: Я понял, что мне нужно преобразовать