Я хотел бы использовать методы машинного обучения, такие как Naive Bayes и SVM в Weka, для идентификации видов с использованием данных последовательности ДНК. Проблема заключается в том, что я должен преобразовать последовательности ДНК в числовые векторы.Преобразование последовательностей ДНК в числовые векторы для R/Weka
МОЯ последовательности, как это:
------------------------------------ ------------ G ------------------------------------ ------ GGAGATG ------------------------------------------ GGAGATG ------------------------------------------ GGAGATG TTATTAATTCGAGCAGAATTAGGAAATCCTGGATCTTTAATTGGTGATG - -------------------------------------------- ATG CTATTAATTCGAGCTGAGCTAAGCCAGCCCGGGGCTCTGCTCGGAGATG - --------------------- TCAACCTGGGGCCCTACTCGGAGACG ---- TAATCCGAGCAGAATTAAGCCAACCTGGCGCCCTACTAGGGGGG CTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATG TTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG --- ATA
Как я могу это сделать? Любое предложение других программ для выполнения ML с ДНК-последовательностями помимо Weka?