Я пишу рекомендательного системного оценщика с Apache Mahout, используя комплект обучения train.csv и метрику точности. Мой вопрос: можно ли использовать фиксированный набор тестов, не генерируемый оценщиком?Оценка рекомендации Mahout - как использовать фиксированный набор тестов
Чтобы быть более конкретным, у меня есть файл test.csv, который содержит список UserIds, и для этого я хочу дать рекомендации и оценить результаты с помощью показателя точности, только для этого фиксированного набора пользователей, который никогда не изменяется. Их рейтинги находятся в файле train.csv, я использую его для обучения алгоритму и содержит также все рейтинги других пользователей.
я пост также код, в котором я хочу, чтобы добавить эту функцию:
RandomUtils.useTestSeed();
DataModel model = new FileDataModel(new File("files/train.csv"));
RecommenderIRStatsEvaluator evaluator = new GenericRecommenderIRStatsEvaluator();
RecommenderBuilder recommenderBuilder = new RecommenderBuilder() {
public Recommender buildRecommender(DataModel model) throws TasteException {
//Here I build my recommender system
//return ...
}
};
IRStatistics stats = evaluator.evaluate(recommenderBuilder, null, model, null, 5,
4/*relevance Threshold*/, 1);
System.out.println(stats.getPrecision());