2014-11-01 2 views
1

В кадре данных я хочу вычесть среднее значение для каждого столбца из каждого элемента этого столбца.R Применить расчет по каждой строке и столбцу кадра данных

Пример кадра данных:

x <- c(1,2,3,4,5,6,7,8,9,10) 
y <- c(2,3,2,3,2,3,2,3,2,3) 
z <- c(100,200,300,400,500,600,700,800,900,1000) 
df <- data.frame(x, y, z) 

# get the mean of each column 
mu <- colMeans(df) 

Я думаю, что нужно использовать sapply, похожие на:

df_norm <- df 
df_norm[,1] <- sapply(df[,1], function(x) (x-mu[1])) 
df_norm[,2] <- sapply(df[,2], function(x) (x-mu[2])) 
df_norm[,3] <- sapply(df[,3], function(x) (x-mu[3])) 

, но я не могу понять, как писать FUN аргумент, чтобы сделать это в одной строке кода.

ответ

2
sapply(df, function(x){x-mean(x)}) 
+0

Теперь почему я не подумал об этом ..! – tospig

2

Вот один из способов:

do.call(cbind,lapply(df,function(col)col-mean(col))) 
#   x y z 
# [1,] -4.5 -0.5 -450 
# [2,] -3.5 0.5 -350 
# [3,] -2.5 -0.5 -250 
# [4,] -1.5 0.5 -150 
# [5,] -0.5 -0.5 -50 
# [6,] 0.5 0.5 50 
# [7,] 1.5 -0.5 150 
# [8,] 2.5 0.5 250 
# [9,] 3.5 -0.5 350 
# [10,] 4.5 0.5 450 
2

Чтобы сохранить структуру data.frame, вы можете сделать:

as.data.frame(Map(`-`, df, mu)) 

или

sweep(df, 2, mu) 

Существует также scale функция, довольно удобно, но он преобразует ваши данные в матрицу:

scale(df, center = TRUE, scale = FALSE) 

Если вы не возражаете преобразования в матрицу, то вы также можете сделать:

t(t(df) - mu) 
+0

Отлично, спасибо. Я также полностью забыл о матричных манипуляциях. – tospig