从品牌网站建设到网络营销策划,从策略到执行的一站式服务
这篇文章主要介绍“如何使用Eagle2进行单倍型分析”,在日常操作中,相信很多人在如何使用Eagle2进行单倍型分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何使用Eagle2进行单倍型分析”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
网站的建设成都创新互联专注网站定制,经验丰富,不做模板,主营网站定制开发.小程序定制开发,H5页面制作!给你焕然一新的设计体验!已为阳光房等企业提供专业服务。
对应的文章发表在nature genetics上,链接如下
https://www.nature.com/articles/ng.3679
核心算法图示如下
对于reference haplotype, 通过PBWT转换之后构建前缀树,树枝的宽度代表了单倍型的频率,频率越高,树枝越宽。对于study样本的分型结果,将可能的单倍型映射到前缀树中,结合HMM模型来预测对应的单倍型。
和shapiet2等软件进行比较,结果如下所示
从图a可以看出,Eagle2的运行时间最快,而且非常恒定,并不会随着reference panel中单倍型的增多而加大运行时间, shapeit2的运行时间和panel size则基本是一个线性关系。
从图b可以看出,panel size的增加有助于降低错误率,而不同软件之间的比较可以发现,Eagle2的错误率最低。利用1000G和HRC两个reference panel进行比较,可以得出相同的结论,结果如下
HRC的单倍型比1000G多很多,利用HRC进行phasing的错误率显著降低。study样本的对运行时间和准确率的影响如下
可以看到,样本越多,运行时间越久,错误率越低。相比shapeit2, Eagle2的运行速度更快,错误率更低。
该软件的基本用法如下
eagle \
--vcfRef HRC.r1-1.GRCh47.chr20.shapeit3.mac5.aa.genotypes.bcf \
--vcfTarget sample.chr1.vcf.gz \
--geneticMapFile genetic_map_chr1_b37.txt
--outPrefix chr1.phased \
要求输入的study样本和reference panel的格式为VCF/BCF, 而且需要tabix的索引,如果是plink格式,可以通过plink2转换成VCF, 官方推荐使用bcftools进行VCF和BCF的格式转换和建立索引操作。
鉴于Eagle2运行速度和准确率的优势,基因型填充的web服务会使用该软件来进行phasing, 以保证运行速度和用户体验。
到此,关于“如何使用Eagle2进行单倍型分析”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图