2016-07-21 3 views
0

Plot of Reads vs Gelscores Средние #Reads для каждой перестановки gelscore?Поиск среднего значения на основе нескольких переменных

Я работаю в лаборатории генетики в своем университете, в настоящее время занимаюсь анализом данных в нашей компьютерной лаборатории. После запуска PCR мы забили наши гели в соответствии с Band, Smear, Primer Dimer и Non Specific Product. Эти переменные, где только назначенные значения 0,1 или 2. Я пытаюсь найти среднее число чтений (результаты последовательности), возвращаемых для каждой комбинации из 4 гель-баллов. Каждая переменная имеет свой собственный столбец в таблице данных.

Спецификация: колба ID, Группа, мазок, Primer.Dimer, Non.Spec, Читает

Ex. Среднее число отсчетов для гелей, где Band = 0, Smear = 0, PrimerDimer = 0 NonSpec = 0.

Ex. Среднее число считываний для гелей, где Band = 0, Smear = 1, PrimerDimer = 1 NonSpec = 2.

Etc.

Любые предложения будут высоко оценены, Спасибо

Я могу построить эти данные с помощью обобщенной функции сюжета. Хотя отображаются средние бары, я не могу определить их значения.

"участок (читает ~ as.factor (техническое описание $ Бэнд + (Primer.Dimer * 10) + (мазок * 100) + (Non.Specific.Product * 1000))"

ответ

0

Вы можете сделать это с помощью в dplyr и tidyr пакеты:

library(dplyr) 
    library(tidyr) 

    set.seed(14592) 

    df <- data.frame(
     vial_id  = 1:10, 
     band   = sample(0:2, 10, replace = TRUE), 
     smear  = sample(0:2, 10, replace = TRUE), 
     primer_dimer = sample(0:2, 10, replace = TRUE), 
     non_spec  = sample(0:2, 10, replace = TRUE), 
     reads  = rnorm(10) 
    ) 

    df %>% 
     unite(group_id, band:non_spec, remove = FALSE) %>% 
     group_by(group_id) %>% 
     summarize(group_mean = mean(reads)) 

Это использует unite функции tidyr, чтобы создать уникальный идентификатор группы для каждой комбинации баллов геля затем использует group_by и summarize функции dplyr, чтобы найти среднее значение чтения для каждой группы

.

 Смежные вопросы

  • Нет связанных вопросов^_^