Я пытаюсь создать программу, которая переводит последовательность ДНК, введенную пользователем 3 альтернативной последовательности белка с помощью следующего словаря (кодоны ключей, аминокислоты являются значением):ДНК с последовательностью белка
{'TGA': '*', 'GCG': 'A', 'CGA': 'R', 'ATA': 'I', 'AGA': 'R', 'TAA': '*', 'TTT': 'F', 'GAG': 'E', 'CTT': 'L', 'CGT': 'R', 'CTC': 'L', 'CTG': 'L', 'TGT': 'C', 'CCA': 'P', 'AAT': 'N', 'GTC': 'V', 'GAC': 'D', 'GAT': 'D', 'TAT': 'Y', 'AAA': 'K', 'GTA': 'V', 'TAG': '*', 'CGC': 'R', 'GCA': 'A', 'TCG': 'S', 'GCT': 'A', 'GCC': 'A', 'TGG': 'W', 'TTC': 'F', 'CCC': 'P', 'TTG': 'L', 'CGG': 'R', 'GGC': 'G', 'AGG': 'R', 'TCC': 'S', 'CCT': 'P', 'GGT': 'G', 'GGG': 'G', 'TCA': 'S', 'AGC': 'S', 'CAG': 'Q', 'CAC': 'H', 'ATC': 'I', 'GAA': 'E', 'GTG': 'V', 'CCG': 'P', 'CAT': 'H', 'AAG': 'K', 'ATG': 'M', 'AAC': 'N', 'TAC': 'Y', 'TGC': 'C', 'CTA': 'L', 'TCT': 'S', 'ATT': 'I', 'ACG': 'T', 'AGT': 'S', 'GTT': 'V', 'TTA': 'L', 'CAA': 'Q', 'GGA': 'G', 'ACC': 'T', 'ACA': 'T', 'ACT': 'T'}
Я хочу просто использовать отображение, а не биотоп. Таким образом, когда программа запущена она должна выглядеть следующим образом:
Please enter a DNA sequence: GCTgttaagactatgaaaagaataagcaacaccatcaat
Frame 1 is AVKTMKRISNTIN
Frame 2 is LLRL*KE*ATPS
Frame 3 is C*DYEKNKQHHQ
Я создал этот словарь из файла, но я не уверен, как начать отсюда. Любая помощь будет принята с благодарностью. Благодаря!
Спасибо так много для быстрого ответа! Это отлично работает для кадра 1, поэтому я предполагаю, что для других кадров я должен отредактировать return [arr [i: i + size] для i в диапазоне (0, len (arr), размер)] до диапазон (1, len (обр.), размер)? – zmoores1
@ zmoores1 Я не уверен, как вы определяете другие кадры. есть ли у вас другие словари? не знакомы с белками. – Uriel
Рамка 1 начинается с символа 1 в последовательности Рамка 2 должна начинаться со 2-го символа, а кадр 3 от третьего символа Игнорировать весь аспект протеина/дна и просто посмотреть на него со словарного отображения. – zmoores1