Я только начинаю с snakemake и задавался вопросом, что такое «правильный» способ запускать набор параметров в одном файле и как это будет работать для цепочки правил?использовать несколько параметров в snakemake
Так, например, когда я хочу иметь несколько методов нормализации, а затем скажем правило кластеризации с различным количеством кластеров k. Что было бы лучшим способом сделать это, чтобы все комбинации выполнялись?
Я начал делать это:
INFILES = ["mytable"]
rule preprocess:
input:
bam=expand("data/{sample}.csv", sample=INFILES, param=config["normmethod"])
output:
bamo=expand("results/{sample}_pp_{param}.csv", sample=INFILES, param=config["normmethod"])
script:
"scripts/preprocess.py"
А затем вызывается скрипт с помощью:
snakemake --config normmethod = Median
Но что на самом деле не масштабироваться для дальнейшие варианты позже в рабочем процессе. Например, как я могу автоматически включить этот набор параметров?
normmethods= ["Median", "Quantile"]
kclusters= [1,3,5,7,10]
Расширение на вашем входе содержит 'param', который не отображается в строке, которая должна быть расширена. Как он себя ведет? – bli
Выполняется код выше. Если я делаю «snakemake --config normmethod = Median», используется метод «Медиана». Если я запускаю рабочий процесс с помощью «snakemake --config normmethod = Mean», используется среднее значение. Соответственно, выходные файлы несут «normmethod param» в их имени файла. –