2014-01-29 1 views
0

У меня есть вмененный набор данных, который я анализирую, и я пытаюсь рисовать ящики, но я не могу окунуться в правильную процедуру.рисование нескольких ящиков из вмененных данных в R

мои данные (образец, оригинал 20 наблюдений за вменение и 13 ВАРА в каждой группу, все значения в диапазоне от 0 до 25):

.imp .id FTE_RM FTE_PD OMZ_RM OMZ_PD 
1  1  25  25  24  24 
1  2  4  0  2  6 
1  3  11  5  3  2 
1  4  12  3  3  3 
2  1  20  15  15  15 
2  2  4  1  2  3 
2  3  0  0  0  6 
2  4  20  0  0  0 

.imp означает вменение раунд, .id относится идентификатор для каждого observartion ,

Я хочу нарисовать все переменные FTE_* в одном сюжете (и `OMZ_ * в другом), но задаться вопросом, что делать со всеми вменениями, могу ли я просто включить все значения? Введенные данные теперь имеют 500 наблюдений. Если, например, ANOVA, мне нужно будет усреднить результаты ANOVA на 5, чтобы вернуться к 20 наблюдениям. Но это также необходимо для коробки, так как я имею дело только с медианными средствами, макс. и мин.?

Такие, как:

data_melt <- melt(df[grep("^FTE_", colnames(df))]) 
ggplot(data_melt, aes(x=variable, y=value))+geom_boxplot() 

Я играл пару раз с ggplot, но считаю себя полным новичком.

ответ

1

Я предполагаю, что вы хотите сохранить идентификатор для .imp и .id после плавления так, а говоря:

data_melt <- melt(df,c(".imp",".id")) 

Для полноты dataframe это, вероятно, помогает ввести столбец, который идентифицирует тип - FTE против . ОМЗ:

data_melt$type <- ifelse(grepl("FTE",data_melt$variable),"FTE","OMZ") 

Имея эту data.frame вы можете, например, фасет по типу (в качестве альтернативы вы можете просто использовать простой оператор фильтра на data_melt ограничить к одному типу):

ggplot(data_melt, aes(x=variable, y=value))+geom_boxplot()+facet_wrap(~type,scales="free_x") 

Это будет выглядеть так. EDIT: исправили данные беспорядок вверх

enter image description here

+0

спасибо, это выглядит очень хорошо! Однако могу ли я просто включить все данные из вменений? сделанное редактирование для уточнения моей точки – puredevotion

+0

Ящики, как указано выше, свяжут все точки данных (т. е. для любой комбинации .imp x .id есть одно значение). Если вы ссылаетесь на статистическую процедуру, которую разрешено включать в правильность, я не могу вам помочь - если у вас есть желание показать только подмножество (т. Е. '.imp == 1'), тогда фильтрация на data_melt будет работать. – CMichael

+0

Почему есть точки на графике, у меня есть и их. Я не могу найти их ... – puredevotion