2015-05-18 5 views
1

У меня есть большой набор данных с COLNAMES:Как создать объект Grange для большого набора данных

"chromosome"  "start"   "end"   "h.gene"  "CPCN_LUNG"  "NCIH524_LUNG" "SBC5_LUNG"  "NCIH446_LUNG" "NCIH196_LUNG" 
    "NCIH209_LUNG" "NCIH1963_LUNG" "NCIH211_LUNG" "NCIH2196_LUNG" "NCIH526_LUNG" "NCIH82_LUNG" "SW1271_LUNG" "DMS114_LUNG" "NCIH2029_LUNG" "NCIH2066_LUNG" "NCIH1341_LUNG" 
    "NCIH2227_LUNG" "NCIH69_LUNG" "NCIH1048_LUNG" "DMS53_LUNG" "SHP77_LUNG" "NCIH1836_LUNG" "NCIH2141_LUNG" "COLO668_LUNG" "NCIH1105_LUNG" "NCIH1876_LUNG" "NCIH841_LUNG" 
"DMS273_LUNG" "CORL279_LUNG" "NCIH1092_LUNG" "CORL95_LUNG" "CORL88_LUNG" "NCIH1694_LUNG" "NCIH1436_LUNG" 

Я хочу, чтобы создать объект Grange этого набора данных.

reference_GRange <- GRanges(seqnames= reference$chromosome,IRanges(start= reference$start,end= reference$end),h.gene=reference$h.gene) 

Это создаст объект Grange, содержащий только 2 столбца метаданных. Есть ли способ создать объект Grange со всей информацией в справочной таблице. [например. с столбцом метаданных из h.gene, CPCN_LUNG, NCIH524_LUNG, ......... до NCIH1436_LUNG)

ответ

5

Использовать makeGRangesFromDataFrame() с keep.extra.columns=TRUE. В качестве альтернативы создайте GRanges, как указано выше, затем добавьте mcols(), опуская неинтересные столбцы.

mcols(gr) = reference[,-(1:3)] 

Не стесняйтесь задавать вопросы о пакетах Bioconductor на Bioconductor support forum.

0

reference_GRange < - GRanges (seqnames = reference $ chromosome, IRanges (начало = ссылка $ start, end = reference $ end), h.gene = reference $ h.gene, CPCN_LUNG = reference $ CPCN_LUNG, NCIH524_LUNG = ссылка $ NCIH524_LUNG, ..... NCIH1436_LUNG = ссылка $ NCIH1436_LUNG).

Но добавьте каждый дополнительный столбец вручную в объект GRnage, который может быть опасным!

+0

Я знаю об этом. Я прошу любой простой способ включить дополнительные столбцы в объект Grange – beginner