Это мой сценарий:Как использовать параллельное программирование/многопоточность в моем сценарии bash?
#!/bin/bash
#script to loop through directories to merge fastq files
sourcedir=/path/to/source
destdir=/path/to/dest
for f in $sourcedir/*
do
fbase=$(basename "$f")
echo "Inside $fbase"
zcat $f/*R1*.fastq.gz | gzip > $destdir/"$fbase"_R1.fastq.gz
zcat $f/*R2*.fastq.gz | gzip > $destdir/"$fbase"_R2.fastq.gz
done
Здесь около 30 подкаталогов в «источнике» каталога. Каждая подкаталог имеет определенные файлы R1 .fastq.gz и R2 .fastq.gz, которые я хочу объединить в один файл R1.fastq.gz и R2.fastq.gz, а затем сохранить объединенный файл в пункт назначения каталог. Мой код работает отлично, но мне нужно ускорить его из-за объема данных. Я просто хочу знать, есть ли способ реализовать многопоточное программирование в моем скрипте? Как запустить мой скрипт так, чтобы параллельно выполнялось несколько заданий? Новое для сценариев bash, поэтому любая помощь будет оценена по достоинству.
Поскольку вы явно имеем дело с биоинформатики вы должны прочитать эти: http://www.biostars.org/p/81359/ http://www.biostars.org/p/63816/ –