snakemake[3:一个简单的WGBS流程]-创新互联-快上网网站建设公司

snakemake[3:一个简单的WGBS流程]-创新互联

参考DNA甲基化数据分析全流程
搭建了一个简单的管道：
先上代码

专注于为中小企业提供网站设计制作、成都网站设计服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业定南免费做网站提供优质的服务。我们立足成都，凝聚了一批互联网行业人才，有力地推动了上千余家企业的稳健成长，帮助中小企业通过网站建设实现规模扩充和转变。

samples:
    cd133/a: SAM/cd133/a.sam
    cd133/b: SAM/cd133/b.sam
    cd133/c: SAM/cd133/c.sam
    cd34/a: SAM/cd34/d.sam
    cd34/a: SAM/cd34/e.sam
    cd34/a: SAM/cd34/f.sam

configfile:"config.yaml"

rule all:
    input:
        expand("SAM/{sample}/bedGraph",group=config["samples"])

def get_input_sam(wildcards):
    return config["samples"][wildcards.sample]

    
rule samToBam:
    input:
        get_input_sam
    output:
        "SAM/{sample}.bam"
    shell:
        "samtools view -S -b -o {output} {input}"

rule bamToSortBam:
    input:
        "SAM/{sample}.bam"
    output:
        "SAM/{sample}.sort.bam"
    shell:
        "samtools sort -m 2000000000 {input} {output}"

rule duplication:
    input:
        "SAM/{sample}.sort.bam"
    output:
        "SAM/{sample}.dup.bam"
    shell:
        "sambamba markdup -t 5 {input} {output} 2>markdup_report.txt"

rule getBadGraph:
    input:
        "SAM/{sample}.dup.bam"
    output:
        "SAM/{group}/bedGraph"
    shell:
        """
        MethylDackel extract /home/data/GRCh37.primary_assembly.genome.fa {input} -o {output}
        MethylDackel extract /home/data/GRCh37.primary_assembly.genome.fa {input} -o {output} --CHG
        MethylDackel extract /home/data/GRCh37.primary_assembly.genome.fa {input} -o {output} --CHH
        """

1 路径

我的数据有很多的样本，每个样本里也有细分的数据。
刚开始想通过嵌套，先获得groups里的group，然后利用group的名字建立键值对对下一级目录进行访问的，但搞了一晚上发现好像有点难，于是直接在samples的键前面加上了对应的目录。
如果有大佬看到了怎么嵌套或有更简洁的方法求指路！

2 流程

.sam—samtools—>.bam
.bam—samtools—>.sort.bam
.sort.bam—sambamba—>.dum.bam
.dum.bam—MethylDackel—>bedGraph

3 小结

在想使用多行shell命令可以使用"""进行标注
get_input_sam(wildcards)函数的实际意义是返回键值对中的值（路径）
all或者最后一步中利用expand定义输出文件的通配符内容

4 文件输入

看了一篇文章里面提到了利用文件建立数据索引的方法。

首先创建一个csv文件

id	name
1	/home/…/…sam
2	/home/…/…sam
…	…

import pandas as pd
samples_table = pd.read_csv("index.csv").set_index("id", drop=False)
print(samples_table.loc[1,"path"])
print(samples_table.index)
rule all:
    input:
         "results/awesome2"
         
def sam_from_sample(wildcards):
  return samples_table.loc[int(wildcards.sample), "path"]

rule a:
    input: 
        sam_from_sample
    output:
        "results/awesome/{sample}_R1.fq"
    shell:
        "echo "
        
rule b:
    input: 
        expand("results/awesome/{sample}_R1.fq",sample=samples_table.index)
    output:
        "results/awesome2"
    shell:
        "echo "

※利用all才可以串联规则a，b
samples_table.loc[int(wildcards.sample), "path"]返回地址
sample=samples_table.index返回索引号
在b中通过id确定a的输出文件然后自动获得对应地址

你是否还在寻找稳定的海外服务器提供商？创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源，准确流量调度确保服务器高可用性，企业级服务器适合批量采购，新人活动首月15元起，快前往官网查看详情吧

网页标题：snakemake[3:一个简单的WGBS流程]-创新互联
分享网址：http://cdkjz.cn/article/dihodd.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

snakemake[3:一个简单的WGBS流程]-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

snakemake[3:一个简单的WGBS流程]-创新互联

相关资讯

腾讯云服务器xshall 腾讯云服务器秒杀

vb点虐 字体选择控件 vb设置字体的代码

go语言解析xml golang 解析xml

java树的实现代码 java树算法

帝国CMS列表页手机版 帝国cms视频教程

阿里云流媒体服务器配置 阿里云 视频流

公司网站设计如何突出现代感

java代码获取今年 java获取下一年

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

vb点虐字体选择控件 vb设置字体的代码

帝国CMS列表页手机版帝国cms视频教程

阿里云流媒体服务器配置阿里云视频流

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接