Я анализ больших наборов данных с помощью следующего сценария:Сделать вложенные петли более эффективными?
M <- c_alignment
c_check <- function(x){
if (x == c_1) {
1
}else{
0
}
}
both_c_check <- function(x){
if (x[res_1] == c_1 && x[res_2] == c_1) {
1
}else{
0
}
}
variance_function <- function(x,y){
sqrt(x*(1-x))*sqrt(y*(1-y))
}
frames_total <- nrow(M)
cols <- ncol(M)
c_vector <- apply(M, 2, max)
freq_vector <- matrix(nrow = sum(c_vector))
co_freq_matrix <- matrix(nrow = sum(c_vector), ncol = sum(c_vector))
insertion <- 0
res_1_insertion <- 0
for (res_1 in 1:cols){
for (c_1 in 1:conf_vector[res_1]){
res_1_insertion <- res_1_insertion + 1
insertion <- insertion + 1
res_1_subset <- sapply(M[,res_1], c_check)
freq_vector[insertion] <- sum(res_1_subset)/frames_total
res_2_insertion <- 0
for (res_2 in 1:cols){
if (is.na(co_freq_matrix[res_1_insertion, res_2_insertion + 1])){
for (c_2 in 1:max(c_vector[res_2])){
res_2_insertion <- res_2_insertion + 1
both_res_subset <- apply(M, 1, both_c_check)
co_freq_matrix[res_1_insertion, res_2_insertion] <- sum(both_res_subset)/frames_total
co_freq_matrix[res_2_insertion, res_1_insertion] <- sum(both_res_subset)/frames_total
}
}
}
}
}
covariance_matrix <- (co_freq_matrix - crossprod(t(freq_vector)))
variance_matrix <- matrix(outer(freq_vector, freq_vector, variance_function), ncol = length(freq_vector))
correlation_coefficient_matrix <- covariance_matrix/variance_matrix
Входная модели будет что-то вроде этого:
1 2 1 4 3
1 3 4 2 1
2 3 3 3 1
1 1 2 1 2
2 3 4 4 2
Что я вычисление биномиальной ковариации для каждого состояния найдено в M[,i]
с каждым штатом, найденным в M[,j]
. Каждая строка - это состояние, найденное для этого процесса, и я хочу посмотреть, как состояние столбцов изменяется.
Уточнение: я нахожу ковариацию двух многочленных распределений, но я делаю это посредством биномиальных сравнений.
Вход представляет собой матрицу 4200 x 510, а значение c для каждого столбца в среднем составляет около 15. Я знаю, что циклы for
ужасно медленны в R, но я не уверен, как я могу использовать функцию apply
здесь. Если у кого-то есть предложение по правильному использованию здесь apply
, я бы очень признателен. Сейчас скрипт занимает несколько часов. Благодаря!
Не могли бы вы добавить небольшой набор данных и то, что вы пытаетесь получить? – aatrujillob
@AndresT Добавлена дополнительная информация. –
Вы пытались включить оптимизатор цикла для разворачивания в компиляторе? –