2015-06-10 2 views
-3

У меня есть записи данных по учетной записи (скажем, уникальные 400 записей). Каждая запись имеет три разные показания указаны премия. Для каждой записи я обеспокоен тем, как показания сравниваются друг с другом. В некоторых случаях показания могут быть относительно линейными, в то время как в других 3 показаниях будут изменчивыми и очень разными. У этих записей также есть состояние, связанное с ними.Построение графика в R 3.1.2

В любом случае, мне интересно, есть ли хороший способ визуализировать различия по записи между тремя показаниями. Кроме того, есть ли хороший способ визуализировать различия индикации по состоянию (возможно, на виде карты в R ??).

Я изобразил распределения каждого отдельного указания с использованием графиков плотности, которая была полезной, но здесь я прошу о визуализации различий между 1, 2 или всех 3 показаниями для каждой записи. Является ли то, что я прошу, возможно?

Большое вам спасибо.

+1

больше людей будут иметь возможность помогите вам, если вы предоставите образцы данных. Кроме того, вас интересуют все возможные различия (например, 1 против 2, 1 против 3, 2 против 3)? Означает ли порядок? – JasonAizkalns

+1

Так в чем ваш вопрос? «... если есть хороший способ визуализации ...»? Если да, то ответ - да, есть хороший способ. Пожалуйста, отправьте данные примера. Мы сможем вам помочь. – PoGibas

+0

Простите меня, но каков наилучший способ опубликовать образцы данных? Кроме того, @JasonAizkalns, да, меня интересуют все возможные различия, которые я считаю (если нет другого способа сделать это, возможно, корреляция?) И порядок не имеет значения. Кроме того, я думаю, что% различий между показаниями будет более полезным, чем номинальная разница. – ActuaryGuy

ответ

1

Возможно, что-то вроде этого является то, что вы после этого, но это было бы проще, если бы вы предоставить образец данных и более описательный в точном задаваемым вопросом:

library(ggplot2) 
library(dplyr) 
library(tidyr) 

df <- data.frame(id = 1:400, 
       state = state.abb, 
       ind1 = rnorm(400), 
       ind2 = rnorm(400), 
       ind3 = rnorm(400)) 

df %>% 
    mutate(diff_1_2 = ind1 - ind2, 
     diff_1_3 = ind1 - ind3, 
     diff_2_3 = ind2 - ind3) %>% 
    gather(metric, value, -c(id, state)) %>% 
    filter(metric %in% c("diff_1_2", "diff_1_3", "diff_2_3")) %>% 
    ggplot(., aes(x = metric, y = value)) + 
    geom_boxplot() + 
    facet_wrap(~ state) 
+0

Мне удалось изменить этот код, чтобы получить то, что мне нужно, я все еще довольно новый для R, так что это был хороший опыт обучения для меня, спасибо вам большое! Тем не менее, у меня есть дополнительный вопрос: можно ли теперь добавить к каждому из государственных сюжетов количество наблюдений, лежащих в основе каждого данного сюжета? – ActuaryGuy