Я пытаюсь сравнить первые цифровые распределения разных наборов данных, но я не могу найти способ (или руководство), чтобы продемонстрировать их с помощью ggplot2. Все используют примеры с «необработанными данными», а не с вероятностями. Вот некоторые из моих данных:ggplot2 Гистограмма вероятности или многоугольник для сравнения распределений
Это желаемые первое распределение цифр (мой тест):
0.30103000 0.17609126 0.12493874 0.09691001 0.07918125 0.06694679 0.05799195 0.05115252 0.04575749
Это первое распределение цифр из двух наборов данных:
0.37101911 0.17515924 0.08917197 0.08121019 0.06210191 0.06050955 0.07484076 0.03662420 0.04936306
0.524419536 0.253002402 0.092073659 0.032826261 0.025620496 0.019215372 0.008807046 0.012009608 0.032025620
Вероятности выше соответствуют вероятности иметь в качестве первой цифры 1, 2, ..., 9.
Ниже представлен график, сделанный издателем пакета, который я использую, чтобы найти приведенные выше вероятности:
1st Dataset first-digit Distribution (the red line is my "benchmark")
Это прекрасно работает. Большое спасибо: D –