2015-03-25 3 views
2

Я хотел бы получить межгенные координаты для хромосомы. Я сделал кусок кода, но я новичок в этих пакетах, я не уверен, если я следую за правильную логику здесь:Поиск межгенных областей

library(IRanges) 
library(GenomicFeatures) 
library(TxDb.Hsapiens.UCSC.hg19.knownGene) 
txdb = transcriptsBy(TxDb.Hsapiens.UCSC.hg19.knownGene, by = "gene",use.names=TRUE) 

#For example, only I am interested in intergenic coordinates in chromosome 1 
seqlevels(txdb, force=TRUE) = c("chr1") 

#Creates IRanges 

ir = IRanges(start=unlist(start(txdb)), end=unlist(end(txdb)), names=names(txdb)) 

# Reduce overlapping gene positions to continuous range 
ir.red = reduce(ir) # Collapses ranges of overlapping genes to continuous range. 

#Identify overlaps among the initial and reduced range data sets 
overlap = findOverlaps(ir, ir.red) 

я должен заботиться о «+» и «-» нитка ?

ответ

2

Самый простой способ начать с генами() сбруя, уменьшить(), что и принять дополнения:

library(TxDb.Hsapiens.UCSC.hg19.knownGene) 
genic <- genes(TxDb.Hsapiens.UCSC.hg19.knownGene) 
genic <- reduce(genic, ignore.strand=T) 
intergenic <- gaps(genic) 
intergenic <- intergenic[strand(intergenic) == "*"] #This is important!!! 

Последний шаг действительно важно, так как в противном случае вы получите дополнительные 2 записи на каждую хромосому (по одному для каждого из + и -).

0

Хотя вы не можете прямо ответить на ваш вопрос, стоит упомянуть, что вы можете получить эти данные непосредственно из UCSC Table Browser, http://genome.ucsc.edu/cgi-bin/hgTables. Браузер таблицы позволяет вам устанавливать пересечения между двумя дорожками или их дополнениями, которые даже могут быть возвращены в пользовательский трек в браузере таблицы для дальнейших операций, что позволяет произвольно сложным вложенным запросам на несколько дорожек и таблиц. Шаги для ваших целей следующие:

1) Выберите свой геном и сборку интересов.

2) Выберите «Гены и предсказания генов» в качестве группы «Гены UCSC» в качестве трека и «knownGene» в качестве таблицы.

3) Если вы хотите одну хромосому или часть хромосомы, введите его в поле на линии «регион», в противном случае оставьте это установлено в «геном»

4) Нажмите на «создать» на линия «пересечения»

5) На следующей странице выберите группу = «Сопоставление и последовательность», трек = «Сборка», таблица = «Сборка (золото)», щелкните по кнопке «Базовая пара- (AND) генов и сборки UCSC », установите флажок« Дополнить гены UCSC до пересечения/объединения базовой пары »и нажмите« отправить ».

6) Вернитесь на главный экран браузера таблицы, введите все, что вы хотите для параметров вывода, и нажмите «get output», чтобы получить межгенные области.

Счастливая охота!