Я провел небольшую последовательность РНК и попытался проанализировать файл результата fastq.Извлечь последовательность положительных ударов из vcountPattern в R
Сначала я импортировал файл fastq в R с использованием пакета ShortRead и преобразуется в DNAstringSet
reads <- readFastq("test.fq")
seq <- sread(reads)
Чтобы искать для чтения, которые содержат определенную строку последовательностей, я использовал vcountPattern из библиотеки Biostrings. Я должен разрешить мутации и цели для моей цели анализа.
hit <-vcountPattern("TCTGCATTTAAGGCAAGTT", seq, max.mismatch=5, with.indels=TRUE)
Что я мог сделать здесь, чтобы подсчитать количество прочтений, что содержащий "TCTGCATTTAAGGCAAGTT"
sum (hit)
возвращает
[1] 11500
Так есть 11500 последовательность читать, содержащие «TCTGCATTTAAGGCAAGTT»
Но, кроме того, w Я хочу, чтобы извлечь фактические последовательности, которые соответствуют 11500 чтениям из файла fastq.
Как я могу это достичь?
hit
Если я просто сделать это, это дает кучу «0», небольшого числа «1», очень немногие из «2». Поэтому я считаю, что это в основном вектор, соответствующий количеству попаданий в каждом чтении.
Я попытался извлечь информацию о последовательности, используя эту информацию, но не смог этого сделать.
Любые помощь приветствуется!
FYI: Пользователь использует пакет Bioconducter «ShortRead» https://darrenjw.wordpress.com/2010/11/29/a-quick-introduction-to-the-bioconductor-shortread-package-for-the- анализ-о-НГС-данные /. Нелегко повторить этот код, если вы не можете дать нам файл fq для игрушек. Знание анализа последовательности полезно здесь. – Sean
Дорогой Холмс, я подготовил игрушку fastq, которую вы можете скачать здесь [link] (https://drive.google.com/file/d/0ByEbUQPY_T_oci1fbDFHSHQ4WUk/view?usp=sharing).Когда я попробовал свой скрипт, используя этот файл fastq, есть 3 положительных момента. В основном я хочу извлечь только положительные удары из файлов fastq. Размер моих исходных файлов fastq в 200 раз больше этого. – gdy
Не обращайте внимания на Холмса, я посмотрел ссылку, которую вы предоставили, и я получил от нее ответ. sread (reads [hit]) решил проблему – gdy