2012-05-10 6 views
3

(это следует ggplot2 loess Q, для которого я получил хороший ответ) - ведущий к этому сюжету: (! Извините)добавить сегменты разбрасывать-участок

answer image to first question

Мой R знания весьма ограничены

Я рисую разброс, используя данные из таблицы data1.

data1<-NaRV.omit(data[,c(2,3,7,10)]) #(2=start, 3=end, 7=value, 10=type) 
ylabs='E/A - ratio' 
p1<-ggplot(data1, aes(x=start, y=value)) + 
ylim(0,5) + 
geom_point(shape=points, col=pointcol1, na.rm=T) + 
geom_hline(aes(yintercept=1, col=linecol)) + 
geom_smooth(method="loess", span=spanv, fullrange=F, se=T, na.rm=T) + 
# 
xlab(xlabs) + 
ylab(ylabs) 

В некоторых регионах нет-данных (в том числе один большой регион в середине, но и более мелкие дискретные области), где я хотел бы нарисовать цветные сегменты при у = 0, чтобы проиллюстрировать этот факт

я объединил оба типа данных в одну таблицу со столбцом метки # 10 = 'type' (содержимое для данных рассеяния = 'cnv' и для no-data = 'nregion'). nregions имеют 0 в столбце value.

Как я могу взять только данные «cnv» для данных разброса и только «nregion» для рисования сегментов; оба на одном и том же участке?

Я нашел geom_segment:

+ geom_segment(aes(x=data1$start, y=0, xend=data1$end, yend=0)) 

но я не нашел способ подмножества для каждого ggplot к югу от участка.

Благодаря

#### следить за @gauden решения

Привет @gauden Я попробовал ваш подход, и он частично работал. Моя проблема в том, что я не могу разделить мои данные так же хорошо, как вы, используя] -1; 0], потому что мои nregions разбросаны (представлены синими точками и линиями на рисунке) и различны для каждого нового графа, так как в этом изображении:

target image with multiple segments

Следовательно, лесс проходит через большой nregion как прежде. Как я могу предотвратить лёсс во владениях?

############################# 
## plot settings (edit below) 
spanv<-0.1 
pointcol1="#E69F00" 
pointcol2="#56B4E9" 
pointcol3="#009E73" 
points=20 
onecol="green" 
colnreg="blue" 
xlabs=paste(onechr, " position", " (loess-span=", spanv, ")", sep="") 

##### end edit ############## 

######################################################## 
## using the center coordinate of each segment and points 

## prepare plot #1 
# plot E/A - ratio 
## draw loess average for cnv 
## draw line for nregion 
ylabs='E/A - ratio' 
p1<-ggplot(chrdata, aes(x=start+1000, y=E.R, group=type, label=type)) + 
ylim(0,5) + 
geom_hline(aes(yintercept=1, col=onecol)) + 
geom_point(data = chrdata[chrdata$type != 'nregion',], shape=points, col=pointcol2) + 
geom_smooth(data = chrdata[chrdata$type != 'nregion',], method="loess", span=spanv) + 
geom_point(data = chrdata[chrdata$type == 'nregion',], col=colnreg) + 
geom_segment(data = chrdata[chrdata$type == 'nregion',], aes(x=start, y=E.R, xend=end, yend=E.R), colour=colnreg, linetype=1, size=1) + 
xlab(xlabs) + 
ylab(ylabs) 

ответ

7

EDIT: Полный пересмотр, чтобы учесть осветленной запросу

Вот моя цель участка: multiple-segment scatter plot

А вот код, который его производит:

library("ggplot2") 

# CREATE DATA FRAME 
# This is the sort of data that I understand you to have 
start <- rnorm(200) 
value <- rnorm(200) 
df <- data.frame(cbind(start, value)) 
df[ df$start > -0.6 & df$start <= 0, "value"] <- 0 
df[ df$start > -1.6 & df$start <= -1.3, "value"] <- 0 
df[ df$start > 0.9 & df$start <= 1.2, "value"] <- 0 

df$type <- rep('cnv', 200) 
df[ df$value == 0, "type"] <- 'nregion' 
df[ df$value != 0, "type"] <- 'cnv' 

# SORT the data frame by value so that the 'cnv' and 
# 'nregion' chunks become contiguous 
df <- df[order(start),] 

# See note below. 
r <- rle(df$type) 
df$label <- rep(seq(from=0, length=length(r$lengths)), times=r$lengths) 

# set up plot with colour aesthetic to distinguish the three regions 
# playing around with colour and group produces different effects 
p <- ggplot(df, aes(x = start, 
        y= value, 
        colour=type, 
        group = label) 
      ) 
p <- p + theme_bw() 
# draw points outside the 'nregion' 
p <- p + geom_point(data = df[df$type != 'nregion',]) 

# draw smoothed lines outside the 'nregion' 
p <- p + geom_smooth(data = df[df$type != 'nregion',]) 


# plot zero points inside the 'nregion' 
p <- p + geom_smooth(data = df[df$type == 'nregion',], size = 2) 
p 

Использование rle поясняется в ответе на вопрос a supplementary question

+0

это eakctly, что я искал, спасибо sooo much @gauden. Теперь я ТОЛЬКО нужно понять синтаксис R и перевести его на свои собственные данные. Отличная поддержка! – splaisan

+0

Дорогой @gauden, я добавил дополнительную информацию о своем верхнем посте со ссылкой на новую картинку. (PS: как я могу пометить на Stackoverflow? У меня недостаточно очков для голосования <15?) – splaisan

+0

вы волшебник! Я также восхищаюсь совместными усилиями нескольких других людей, которые отвечают на ваш дополнительный вопрос (как я могу лучше всего вознаградить всех вас?). Теперь это полностью соответствует моим потребностям. Я понимаю, что мне еще предстоит пройти долгий путь в R с базовым perl-знанием, которое здесь нелегко перевести.Структура вектора противоречит интуиции моей биологии, и мне всегда приходится бороться за ее получение. Во всяком случае, я желаю вам очень хорошего дня и СПАСИБО вам за помощь и учение. – splaisan

 Смежные вопросы

  • Нет связанных вопросов^_^