Я пытаюсь создать некоторые файлы для генетического анализа. Я начинающий питон. Файлы, которые я хочу сделать, должны быть 3 столбца, разделенные вкладки, первый столбец всегда один и тот же (номер хромосомы) и окна второго и третьего столбцов размером 200, начинающиеся с нуля и заканчивающиеся на конце хромосомы. Например:Python скрипт для создания базового файла с информацией о хромосомах
chr20 0 200
chr20 200 400
chr20 400 600
chr20 600 800
...
у меня размер хромосомы поэтому на данный момент я пытаюсь сказать, «в то время как колонка 2 < (размер хромового) печатной линии. У меня есть скелет скрипта, но он не совсем работает из-за моего отсутствия опыта. Вот то, что я до сих пор:
output = open('/homw/genotyping/wholegenome/Chr20.bed', 'rw')
column2 = 0
column1 = 0
while column2 < 55268282:
for line in output:
column1 = column1 + 0
column2 = column2 + 100
print output >> "chr20" + '\t' + str(column1) + '\t' + str(column2)
Если кто-то может исправить этот простой сценарий так, что он делает, как я описал, или пишет лучшее решение, которое будет действительно оценили. Я рассмотрел создание сценария, который мог бы выводить все файлы для 20 хромосом и chrX, но поскольку мне нужно указать размер хромосомы, я думаю, что мне придется делать каждый файл отдельно.
Заранее благодарен!
хорошо, но я получаю сообщение об ошибке «нулевой длины имени поля в формате» – user964689
@are вы используете Python 2.6? Тогда просто измените ответ, но вам нужно только это: 'outfp.write ('{0} {1: 4d} {2: 4d} \ n'' ... – Levon
Я действительно. Спасибо, хотя как я должен сначала определить шаги? – user964689