ggplot2 Гистограмма вероятности или многоугольник для сравнения распределений

Я пытаюсь сравнить первые цифровые распределения разных наборов данных, но я не могу найти способ (или руководство), чтобы продемонстрировать их с помощью ggplot2. Все используют примеры с «необработанными данными», а не с вероятностями. Вот некоторые из моих данных:ggplot2 Гистограмма вероятности или многоугольник для сравнения распределений

Это желаемые первое распределение цифр (мой тест):

0.30103000 0.17609126 0.12493874 0.09691001 0.07918125 0.06694679 0.05799195 0.05115252 0.04575749

Это первое распределение цифр из двух наборов данных:

0.37101911 0.17515924 0.08917197 0.08121019 0.06210191 0.06050955 0.07484076 0.03662420 0.04936306 
0.524419536 0.253002402 0.092073659 0.032826261 0.025620496 0.019215372 0.008807046 0.012009608 0.032025620

Вероятности выше соответствуют вероятности иметь в качестве первой цифры 1, 2, ..., 9.

Ниже представлен график, сделанный издателем пакета, который я использую, чтобы найти приведенные выше вероятности:

1st Dataset first-digit Distribution (the red line is my "benchmark")

источник

2017-02-19 Μπαρδάκος Βασίλειος

Поскольку вы предварительно вычислены вероятности, вы можете построить их с geom_line.

dat = read.table(text="0.30103000 0.17609126 0.12493874 0.09691001 0.07918125 0.06694679 0.05799195 0.05115252 0.04575749 

       0.37101911 0.17515924 0.08917197 0.08121019 0.06210191 0.06050955 0.07484076 0.03662420 0.04936306 
       0.524419536 0.253002402 0.092073659 0.032826261 0.025620496 0.019215372 0.008807046 0.012009608 0.032025620", header=FALSE) 
dat = setNames(as.data.frame(t(dat)), c("Reference", "D1","D2")) 
dat$digits = 1:9 

library(ggplot2) 
library(reshape2) 

ggplot(melt(dat, id.var="digits"), aes(digits, value, colour=variable)) + 
    geom_point() + 
    geom_line(aes(size=variable)) + 
    theme_bw() + 
    scale_x_continuous(breaks=1:9) + 
    scale_size_manual(values=c(1.2,0.5,0.5)) + 
    scale_colour_manual(values=c("black",hcl(c(15,195),100,65))) + 
    labs(x="First Digit", y="Probability", colour="", size="")

источник

2017-02-19 18:24:15 eipi10

Это прекрасно работает. Большое спасибо: D –

ggplot2 Гистограмма вероятности или многоугольник для сравнения распределений

ответ

Смежные вопросы