2014-01-11 3 views
8

Я хочу создать следующий график плотности гистограммы с ggplot2. В "нормальном" пути (базовые пакеты) очень просто:Создание гистограммы плотности в ggplot2?

set.seed(46) 
vector <- rnorm(500) 
breaks <- quantile(vector,seq(0,1,by=0.1)) 
labels = 1:(length(breaks)-1) 
den = density(vector) 
hist(df$vector, 
    breaks=breaks, 
    col=rainbow(length(breaks)), 
    probability=TRUE) 
lines(den) 

enter image description here

С ggplot я дошел до этого до сих пор:

seg <- cut(vector,breaks, 
      labels=labels, 
      include.lowest = TRUE, right = TRUE) 
df = data.frame(vector=vector,seg=seg) 

ggplot(df) + 
    geom_histogram(breaks=breaks, 
        aes(x=vector, 
         y=..density.., 
         fill=seg)) + 
    geom_density(aes(x=vector, 
         y=..density..)) 

Но "у" масштаб имеет неправильный размер. Я отметил, что следующий пробег получает шкалу «y» вправо.

ggplot(df) + 
    geom_histogram(breaks=breaks, 
        aes(x=vector, 
        y=..density.., 
        fill=seg)) + 
    geom_density(aes(x=vector, 
         y=..density..)) 

Я просто не понимаю. y=..density.. есть, это должно быть высота. Так почему же мой масштаб изменяется, когда я пытаюсь его заполнить?

Мне нужны цвета. Я просто хочу гистограмму, где разрывы и цвета каждого блока настраиваются в соответствии с цветами заливки ggplot по умолчанию.

+0

Я редактировал ваше представление так, что код будет соответствовать на странице. Вас могут заинтересовать предложения Google о том, как закодировать для максимальной удобочитаемости и полезности: см. Http://google-styleguide.googlecode.com/svn/trunk/Rguide.xml –

ответ

8

Вручную, я добавил цвета к вашим процентилилам. Посмотрите, работает ли это для вас.

library(ggplot2) 

ggplot(df, aes(x=vector)) + 
    geom_histogram(breaks=breaks,aes(y=..density..),colour="black",fill=c("red","orange","yellow","lightgreen","green","darkgreen","blue","darkblue","purple","pink")) + 
    geom_density(aes(y=..density..)) + 
    scale_x_continuous(breaks=c(-3,-2,-1,0,1,2,3)) + 
    ylab("Density") + xlab("df$vector") + ggtitle("Histogram of df$vector") + 
    theme_bw() + theme(plot.title=element_text(size=20), 
         axis.title.y=element_text(size = 16, vjust=+0.2), 
         axis.title.x=element_text(size = 16, vjust=-0.2), 
         axis.text.y=element_text(size = 14), 
         axis.text.x=element_text(size = 14), 
         panel.grid.major = element_blank(), 
         panel.grid.minor = element_blank()) 

enter image description here

+1

спасибо, я искал альтернативные решения, но я оказался с твоим. – Usobi

1

fill=seg результаты группировки. Фактически вы получаете другую гистограмму для каждого значения seg. Если вам не нужны цвета, вы можете использовать это:

ggplot(df) + 
    geom_histogram(breaks=breaks,aes(x=vector,y=..density..), position="identity") + 
    geom_density(aes(x=vector,y=..density..)) 

enter image description here

Если вам нужны цвета, это может быть проще вычислить значение плотности вне ggplot2.

+0

, но высота по-прежнему будет неправильной, не так ли? – Usobi

+0

Извините, я не понимаю вашего комментария. – Roland