B37、hg19、GRCh37、GRCh38这4种参考基因组的区别。

来自disease
Suqingdong讨论 | 贡献2020年10月19日 (一) 09:12的版本
跳到导航 跳到搜索


我们使用的是GRCh37的升级版g1k b37,简称b37。b37与hg19、GRCh37、GRCh38的区别:

(1)GRCh37和b37的区别:

b37是GRCh37的升级版,在GRCh37基础上增加了一些scaffold(人的序列,但是还没有组装定位到具体的位置),一条病毒序列(疱疹病毒),一条decoy序列(hs37d5,来自BAC或者质粒克隆等,没有具体的变异检测的作用,增加比对率),并且在Y染色体上把X,Y染色体的同源区mark 成了N。

(2)hg 19与b37的区别:

hg19与b37的坐标系统一样,1-X,Y染色体一模一样。区别是(不考虑scaffold的区别):线粒体有差别(版本不一样,b37用的是修正版的NC_012920,而hg19是老版的NC_001807)。hg19来自UCSC,UCSC参考基因组中有大小写碱基,小写表示在repeat区(Repeats from RepeatMasker and Tandem Repeats Finder)。染色体编号表示不同,hg19带有chr,b37直接是染色体编号.

(3)GRCh37和GRCh38(hg38)的区别:与GRCh37相比,GRCh38替换了8000个等位基因位点,校正了数个组装错误的基因组区域,补全了gap,添加了着丝粒序列,在178个区域组装了261条alternate loci,丰富了基因组的多样性。具体见文献:Guo Y, Dai Y, Yu H, et al. Improvements and impacts of GRCh38 human reference on high throughput sequencing data analysis[J]. Genomics, 2017, 109(2): 83-90。

0.00
(0票)


添加您的评论
disease欢迎所有评论。如果您不想匿名,注册登录。它是免费的。