今年是人类参考基因组草图序列公布20周年,然而目前公布的基因组还存在诸如序列不完整等问题。记者从华大集团获悉,近日以我国科学家为主导,中外科学家共同合作,以狨猴为模式,首次用新方式对该非人灵长类动物全基因组数据进行分析和组装,为高质量基因组分析找到了新模式。该重量级成果已于4月28日发表于英国著名的学术期刊《自然》杂志。
据悉,此次研究所运用的新型测序组装技术有望在未来,通过精准医学的实施,利用遗传信息根据每个人独特的遗传特征来定制干预措施,以预防和治愈从精神疾病到癌症的各种疾病。
文/广州日报全媒体记者鲍文娟 通讯员杨莹
首次直接比较来自父母的两套染色体
“正常人的体细胞内有46条23对染色体,但传统方法在测序后只能组装出22条常染色体再加上XY染色体,也就是24条。”深圳华大生命科学研究院和哥本哈根大学联合培养的博士生杨琛涛介绍,染色体DNA是很长的生物大分子,由四种碱基按照特定的顺序排列,这些独特的排列顺序代表了生物的遗传信息。
然而目前已公布的基因组还存在着诸如序列不完整缺点。一个二倍体生物的两套染色体各来自父母一方,而目前的大多数基因组研究往往只能得到一套父母本遗传信息混合的基因组。
“个体的染色体是成对的存在的,一条来自父亲,一条来自母亲,两条对应的常染色体演化起源相同、序列相似,但又存在遗传差异。组装时,在某些有差异的区域算法无法区分它们,这时候只能随机保留其中一条的数据。比如两条1号染色体的数据,最终会拼接成1条父母本‘嵌合’的1号染色体。” 杨琛涛解释说。
“我们在狨猴基因组测序中首次尝试了新的方法。” 本文共同第一作者、深圳华大生命科学研究院生物信息副研究员周旸说,“利用被测个体的父母本的测序数据进行遗传信息区分,我们的算法可以完美地将两条同源染色体分别组装出来。这样,我们就能获得全部染色体的遗传数据。”
“得益于新的高质量染色体数据,我们可以对来自父亲和来自母亲的两套染色体进行直接地比较。”杨琛涛表示,“如果考虑到所有类型的遗传变异,目前一般得出的杂合率结果被远远低估了。另外,有意思的是,来自父亲的种系突变是来自母亲的两倍。这可能与卵细胞和精子的形成过程中细胞发生复制分裂的次数不同有关。”
狨猴高质量遗传信息可推进人类疾病研究
狨猴是人类基因组计划(HGP)的延续、脊椎动物基因组计划(VGP)的其中一个研究对象。普通狨猴是生活在巴西东北部大西洋沿海地区热带地区的一种小型猴子。成年的狨猴只有手掌大小,是世界上体型最小的灵长类之一 。
狨猴食性较杂,在野生环境下以昆虫、蜘蛛等无脊椎动物、一些小型脊椎动物、或树木的渗出液等为食。
作为狨亚科的代表性物种,狨猴与人类在生理学等方面有着高度的相似性,同时具有繁殖周期短、体型小,生双胞胎等优势,因此成为研究人类疾病的模式物种之一。“狨猴与人类在解剖学、生理学和药物代谢方面具有许多共同特征,因此能开发出多种医学研究模型。这些模型可以应用到神经退行性疾病、生殖生物学、药物动力学及药物的毒性筛查、干细胞研究、自身免疫性疾病、感染性疾病等多方向的研究中。”杨琛涛进一步解释说,“因此,对狨猴高质量遗传信息的解读,对于推进人类疾病研究非常重要。”
“我们当然也对狨猴本身进行了分析。”周旸补充说,“我们发现了狨猴Y染色体的特殊演化区域,也找到一些其他的有趣基因。”“我们发现狨猴的Y染色体上比人多出了一段雄性特异性序列,而且在一些参与人类精子形成的基因在狨猴中丢失或者失去功能,这些变化可能与狨猴形成的婚配方式相关。我们也发现了一些卵细胞发育、卵巢功能相关的基因在狨猴里累积了许多有利于自然选择的变异,可能与狨猴更容易产下双胞胎的生殖方式有关。”
“我们发现大部分与大脑相关的基因在人和狨猴之间在序列上是高度保守的,这一定程度上解释了狨猴可以作为研究人类神经疾病模式物种的遗传学基础。我们也发现了一些在狨猴中和它们身体大小,繁殖特征,饮食习惯相关的基因受到了正选择。这些发现扩展了之前的一些研究结果,增加了我们对狨猴物种本身的了解。”
新型测序组装技术有望助力医疗
“2021年是人类参考基因组草图序列公布20周年。但如何构建参考基因组序列仍是当前基因组研究的重点攻关领域。基因组中包含大量与健康、疾病和表型相关序列,对这些序列的研究有赖于基因组序列的准确度。” 该研究的通讯作者,深圳华大生命科学研究院、中国科学院昆明动物研究所及丹麦哥本哈根大学的张国捷教授介绍“近几年对基因组序列功能的研究对获得更高质量基因组提出了的新要求。完美参考基因组序列的定义也一直随着测序技术发展而更新。”
“在此我们对二倍体物种完美基因组序列提出了新的标准,即二倍体细胞中的两套基因组应分别独立组装到染色体水平并含有极少的测序漏洞。本次研究我们论证了实现这一目标的可行性。”教授总结说。
“另外,高质量的狨猴基因组也利用这个物种作为动物模型的医学研究提供重要遗传数据。” 张国捷教授表示,通过对狨猴这个生物医学模式物种的基因组测序和组装,研究团队展示了新型测序组装技术极大的应用潜力。
而这类型技术有望在未来,通过精准医学的实施,利用遗传信息根据每个人独特的遗传特征来定制干预措施,以预防和治愈从精神疾病到癌症的疾病。