2013-03-19 8 views
0

Я искал через сайт, но не смог найти решение моей проблемы. У меня есть образец набор данные следующим образом:Распределенные распределения частот от номинальных переменных в R

id,l1 
1,3 
2,5 
3,6 
1,5 
2,4 
3,6 

идентификатора является номинальным переменным и представляет собой уникальный пользователь, а другие является переменным счетчиком.

Я хочу узнать о распределении l1 от пользователя. Итак, глядя на мой данный набор данных, id = 1 имеет общее l1 = 8; id = 2 имеет общее значение l1 = 9 и id = 3 имеет общее значение l1 = 12.

Я пытаюсь выяснить распределение l1 в соответствии с идентификатором, но я застрял. Я не могу понять, как сгруппировать соответствующие столбцы вместе, а затем найти распределение или, по крайней мере, построить гистограмму. Я могу построить гистограмму с одной переменной, но я не могу построить распределенное распределение по частоте по номинальной переменной.

ответ

2

baseR подход будет использовать tapply

Если data.frame называли aa

sumById <- with(aa, tapply(l1,id, sum))) 

barplot(sumById) 

enter image description here

Если вы хотите, чтобы построить свои результаты без явного presumarizing, то вы могут использовать ggplot2 и stat_summary

library(ggplot2) 
ggplot(aa, aes(x = id, y = l1)) + stat_summary(fun.y = 'sum', geom = 'bar') 

enter image description here

+0

Спасибо. Это было очень полезно. Я получил именно то, что мне было нужно. – Shion

 Смежные вопросы

  • Нет связанных вопросов^_^