对于GnomAD、ESP6500、ClinVar这些数据库的过滤有没有什么建议,比如低于或高于什么标准可以丢弃?

来自disease
Suqingdong讨论 | 贡献2020年10月19日 (一) 09:12的版本 (导入1个版本)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索


我们通常认为,致病变异是低频罕见的,因此老师可以优先关注在这几个数据库中注释频率较低的位点(GnomAD和esp6500数据库频率注释,建议您优先关注频率小于0.01以下的位点)。

esp6500:国家心肺和血液研究所外显子组测序计划(NHLBI-ESP project,esp6500si_all数据库中包含SNP变异、InDel变异和Y染色体上的变异的所有个体中,突变碱基的等位基因频率(alternative allele frequency)。

GnomAD是The Genome Aggregation Database的简称,涵盖了来自不相关个体的123,136个外显子序列和15,496个全基因组序列,作为各种疾病特异性和群体遗传研究的一部分进行测序。

clinvar:注释变异与人类健康之间的关系,临床意义的数据来源于NCBI 格式为:CLINSIG=non-pathogenic;CLNDBN=not_specified;CLNREVSTAT=single;CLNACC=RCV000116259.1;CLNDSDB=MedGen;CLNDSDBID=CN169374。CLINSIG代表变异位点在临床意义,可取值为unknown, untested, non-pathogenic, probable-non-pathogenic, probable-pathogenic, pathogenic, drug-response, histocompatibility, other。CLINDBN代表变异位点相关的疾病名称。CLNREVSTAT 代表该条临床信息的核查情况,取值为mult、single、not、exp、prof。CLNACC代表变异在CLINVAR数据库中的accession号和版本号。CLNDSDB是疾病关联信息的数据库来源,CLNDSDBID是数据库中的编号。

0.00
(0票)


添加您的评论
disease欢迎所有评论。如果您不想匿名,注册登录。它是免费的。