2012-11-11 4 views
0

Im учится использовать Rapidminer для проекта. Я застрял в какой-то момент. У меня есть набор данных следующим образом: Есть страны. Для каждой страны я отслеживаю некоторые ценности (скажем, медали) за 1990-2012 годы. В качестве примера:Rapidminer/Excel Отсутствует стоимость замены

  • Страна Год Золото Серебро Бронза


    USA  1990 10  5   7 
    ..... 
    USA  2012 12  3   8 
    Spain 1990 8  12  9 
    ... 
    Spain 1992 7  ?   8 
    .... 
    Spain 2012 4  11  12 
    ...GOES ON... 
    

То, что я хочу сделать, это заменить отсутствующие значения. Например, Испания имеет недостающее значение в 1992 году за серебряные медали. Я хочу найти среднее значение для данных Silver для Испании и заменить недостающее значение на это. Как я могу это сделать? Если нынешние модули в Rapidminer не могут этого сделать, есть ли какой-то макрос и т. Д.? Я также могу использовать Excel для предварительной обработки данных (но как) ???.

ответ

0

Используйте оператора Replace Missing Values. Его настройки по умолчанию заполняют любые отсутствующие данные средним значением этого столбца - именно то, что вы хотите.