8篇论文!《科学》刊发中国科学家灵长类基因组计划阶段性成果
来源:澎湃新闻 2023-06-02 09:16
·“研究灵长类演化的过程和与近缘物种的基因组比较可以告诉我们哪些DNA序列是真正人类特异的,这些人类特异的DNA序列往往对人类独特性状的出现和正常发育发挥了重要作用。另一方面,我们还可以知道哪些DNA序列是人类和其他物种共有的,甚至在长期的演化过程中几乎没有发生任何变化,而这些序列一旦在现代人里出现变异,往往会导致疾病或者不良表型。”
非人灵长类动物是人类的“近亲”,你可能会立刻想到各种猴子,但灵长类动物的范畴远不止于此。灵长目(Primates)是哺乳纲下的一个目,分为2个亚目——原猴亚目和简鼻亚目,共有16科79个属种,500余个物种。人类也是其中一员。
灵长目演化树。图片由Stephen D. Nash绘制,张国捷课题组和吴东东课题组合作供图
研究非人灵长类动物起源和演化可以为揭示人类的起源,以及人类何以形成独特的身体结构特征提供线索。
当地时间6月1日,由中国科学家组织的灵长类基因组计划发布阶段性成果,共计8篇论文,以研究专刊的形式发表于《科学》(Science)杂志,其中4篇为该计划产生的主要论文,另外4篇为该计划扩展的国际灵长类研究联盟产生的论文。此外还有3篇论文已经或即将在《科学进展》(Science Advances)、《自然-生态与演化》(Nature Ecology & Evolution)等知名学术期刊发表。
这些论文探讨了灵长类物种的起源和分化过程、灵长类社会行为和社会组织的起源,以及大脑等各种生理特征的演化和遗传基础。
据《科学》杂志的专刊简介介绍,“60%的灵长类动物面临灭绝威胁,通过这次表征其基因组的努力,希望可以为保护人类和其他灵长类成员提供更多理解。”
8篇论文以研究专刊的形式发表于《科学》杂志。图片来源:《科学》
新增27个高质量灵长类基因组数据
该计划的旗舰论文题为《基因组学分析提供了对灵长类演化的洞见》(Phylogenomic analyses provide insights into primate evolution),由浙江大学生命演化研究中心张国捷教授团队、昆明动物研究所吴东东教授团队、西北大学齐晓光教授团队和其他国内外合作者共同完成。
“我们利用第三代基因测序技术,获取了27个新的高质量灵长类基因组数据,加上过去已经发表的23个灵长类基因组数据,这次的研究共包括50个灵长类动物的基因组数据,覆盖了绝大部分科的物种,尤其是在一些演化的关键节点上。”5月26日,张国捷课题组成员之一周龙向澎湃科技介绍。
结合基因组数据和化石时间数据进行分析,研究人员推断出了灵长类动物各主要类群的演化时间,并推断出所有灵长类的最近共同祖先出现在大约6829万到6495万年前。这一时间距离6550万年前造成非鸟恐龙灭绝的白垩纪末期大灭绝事件非常近,研究人员认为,这意味着灵长类动物的演化可能受到物种大灭绝事件的影响。
该研究采用更多染色体级别的原猴物种进行研究,修正了人类8号染色体起源的假说。旧假说认为,人的8号染色体是继承自灵长类的祖先某条祖先染色体,这条染色体在新世界猴中发生了断裂事件,分化出两条新的染色体。而该研究发现,人的8号染色体对应到原猴的两条染色体上,研究人员据此推测类人猿下目祖先以及所有灵长类祖先中的两条染色体在狭鼻类出现后融合成一条染色体,最终演变成人类8号染色体。
该研究还发现,在灵长类祖先到人的演化历程中,灵长类的相对脑容量在四个关键的演化节点显著增大,分别为类人猿下目的祖先、狭鼻类祖先、大猿祖先和人类,这种趋势在人类中达到了顶峰。
在灵长类大脑演化的过程中,研究人员发现,一些基因受到了强烈的正向选择(在自然界的选择下,某一位点逐渐积累,成为优势位点),其中包括一些已经被前人的研究证明为大脑发育关键的基因,如果这些基因紊乱,往往会导致大脑疾病的产生。例如小头畸形,一种严重的神经系统缺陷,患者的脑容量由于神经细胞增殖能力受阻而变小。与小头畸形相关的基因在灵长类演化的多个分支受到强烈的正向选择,被认为可能在人类脑容量增大中发挥了作用。
灵长类不同分支跟小头畸形相关的受到正选择的基因列表。张国捷课题组和吴东东课题组合作供图
“人类的一个很明显的特点就是比其他的动物聪明,体现在生理构造上是大脑容量更大,大脑皮层的褶皱更多,我们的研究把人类比其他动物更聪明的原因定位到了基因以及其相关的调控区域上。”周龙介绍。
寒冷气候驱动灵长类复杂社会的形成
人类的社会分成了家庭、家族、氏族等不同的组织层次,这种复杂的社会组织形式被称为“重层社会”(multilevel society),这一现象也出现在包括金丝猴、部分叶猴在内的亚洲叶猴类中。灵长类的复杂社会组织形式是如何形成的?西北大学齐晓光教授、李保国教授,中国科学院昆明动物所吴东东研究员、澳大利亚西澳大学(The University of Western Australia)西里尔·格鲁特(Cyril C. Grueter)研究员等主导的联合研究团队共同回答了这个问题,相关成果以《对寒冷气候的适应推动亚洲叶猴的社会演化》(Adaptations to a cold climate promoted social evolution in Asian colobine primates)为题发表于《科学》杂志。
该研究从亚洲叶猴所有7个属中,各挑选出1个代表性物种,测序并组装了7个物种的全基因组,并根据4992个直系同源组,结合最新的化石证据,构建了可靠的系统发育树,支持亚洲叶猴类在约750万年前分化为两支,即经典叶猴类和金丝猴等奇鼻猴类,并理顺了颇具争议的属间关系。研究人员从系统发育、生物地理等多角度还原了亚洲叶猴类的演化历史,提出了亚洲叶猴类从喜马拉雅山南麓到达东亚、东南亚地区的历史扩散路线,挑战了亚洲叶猴的祖先从北方南下进入东亚的观点。
根据新的系统发育树、扩散路线和地质变化,研究团队认为寒冷气候是推动亚洲叶猴形成重层社会的重要因素。进一步研究发现,能量代谢和神经内分泌相关的基因在发生了社会聚合的奇鼻猴类中经历了快速演化。其中,催产素和多巴胺通路的功能与社会组织的复杂程度呈正相关。这些结果表明,以这两种神经递质为代表的神经-内分泌系统的重塑很可能是亚洲叶猴形成更大、更稳定社会的生理基础。
杂交驱动灵长类新物种形成
第三篇论文关注金丝猴的“身世”,由云南大学于黎教授联合多个课题组共同完成,题为《黔金丝猴,一种灵长类动物的杂交起源》(Hybrid origin of a primate, the gray snub-nosed monkey)。
金丝猴并不都是金色的。在生物分类学上,金丝猴属于灵长目猴科下的仰鼻猴属(Rhinopithecus),一共有5个物种,分别是川金丝猴(R. roxellana)、滇金丝猴(R. bieti)、黔金丝猴(R. brelichi)、怒江金丝猴(R. strykeri)和越南金丝猴(R. avunculus)。其中,真正浑身金毛的只有中国四川、陕西、甘肃等地的川金丝猴,滇金丝猴黑背白腹怒江金丝猴通体黑色毛发。而黔金丝猴的毛发更是特别,它们的头部与肩膀等处为金色毛发,其他部位则覆盖深色毛发。
黔金丝猴独特的毛发是如何形成的?从这一问题出发,研究人员通过比较基因组学分析发现,黔金丝猴是川金丝猴和滇金丝猴/怒江金丝猴共同祖先杂交后形成的物种,在演化过程中与两个祖先物种形成了生殖隔离(指两个物种由于地理隔离等各种原因无法进行基因的交流,表现为两个物种无法交配,交配后无法诞生后代,或后代不可育等),进而成为一个新的独立物种。黔金丝猴的毛发颜色实际是川、滇以及怒江金丝猴毛色的嵌合体,其毛发基因有些来源于川金丝猴,有些来源于滇/怒江金丝猴的共同祖先。
“杂交事件很普遍,但物种之间杂交形成全新的物种,在动物界比较罕见,在灵长类动物中是首次报道。”周龙对澎湃科技记者说。
值得一提的是,此次发表于《科学进展》的研究中也发现了类似的杂交成种现象:猕猴类中的食蟹猴种组(包含3个物种)是狮尾猴种组的祖先与斯里兰卡种组的祖先杂交后形成的新物种类群。同时国际合作团队也在《科学》杂志发表了《全基因组共祖分析揭示了狒狒古代和近期由雄性驱动的遗传混合》(Genome-wide coancestry reveals details of ancient and recent male-driven reticulation in baboons)为标题的论文,揭示了东非狒狒和黄狒狒之间复杂的遗传背景和演化历史和雄性狒狒离群活动而驱动的近缘物种间的基因交流有关。这表明,杂交是灵长类动物物种形成的重要驱动力之一。
不完全谱系分流影响物种分化
和大猩猩相比,人与黑猩猩的亲缘关系更近,但在人的基因组里却有超过15%的基因组区域跟大猩猩更相似。这在遗传学上被称为不完全谱系分流(incomplete lineage sorting,ILS),即亲缘关系较远的物种之间在某些基因上存在相似性。不完全谱系分流在多个物种中都已被观察到过。
不完全谱系分流在多大程度上影响灵长类物种的分化?张国捷团队与丹麦奥胡斯大学(Aarhus University)米凯尔·舒尔普(Mikkel H. Schierup)团队共同合作,利用全基因组数据对29个灵长类祖先节点的不完全谱系分流现象进行了分析,发现在灵长类所有演化节点上,灵长类基因组有5%-64%的区域发生了不完全谱系分流,表明在灵长类的演化历程中,不完全谱系分流在某些时间曾产生了较大的影响。
而且基因组上存在某些区域,在整个灵长类的演化过程中一直保持着较高或者较低的不完全谱系分流水平,这反映这些区域曾面临不同的选择压力。例如与转录调节相关的看家基因(指所有细胞中均要稳定表达的一类基因,其产物是维持细胞基本生命活动所必需的)PIAS3,在几乎29个祖先节点都表现出了较低的不完全谱系分流水平,而与免疫相关的CD1A基因,在整个演化历程中都表现出较高的不完全谱系分流水平。
该论文题为《不完全谱系分流在灵长类演化过程中的影响以及其和选择作用的关系》(Pervasive incomplete lineage sorting illuminates speciation and selection in primates)。
遗传多样性与物种灭绝风险无直接关联
物种灭绝风险是否与遗传多样性的丧失相关是一个长期被讨论的问题。“一般认为,物种多样性越多,物种对于环境的适应性就越强,当环境陡然发生变化时,物种中就有更多的个体容易适应环境变化,从而生存下来。”周龙向澎湃科技记者解释。
西班牙庞培法布拉大学(Universitat Pompeu Fabra)托马斯·马奎斯-博内特(Tomàs Marquès-Bonet)教授领衔的多家国际团队,对来自211个灵长类动物的703个个体基因组进行了高深度测序。综合先前发表的29个物种共计106个个体数据,构建了目前多样性最丰富的灵长类物种基因组数据集,涵盖了灵长类动物全部的科、86%的属和47%的物种。这被认为是迄今为止最丰富的灵长类物种基因组数据集。相关论文以《来自233种灵长类动物的全基因组多样性全球目录》(A global catalog of whole-genome diversity from 233 primate species)为题发表于《科学》杂志。
研究团队对这些来自233种灵长类动物的809个个体基因组的重测序数据进行了分析,基于基因组杂合性和连续性纯合片段(RoH)长度的结果表明,基因组多样性与世界自然保护联盟划定的灭绝风险类别之间在整体上没有直接关联。
这也就说明,灵长类的遗传多样性不能完全表征物种的濒危程度,物种濒危状态的形成很大程度上受到非遗传因素的威胁。“在此次研究中遗传多样性对物种灭绝的影响没有那么大,但是灵长类动物的研究结果不能代表所有物种。不能因此而不关心遗传多样性,它仍然是很重要的。”周龙说。
用灵长类基因组数据训练AI,识别人类致病基因突变
随着人类基因组计划(HGP)的完成及基因测序技术的发展,研究人员已经揭示了个体之间大量的基因变异,并找出了许多特定基因的突变与疾病的关系。然而在人类基因组中,可能导致蛋白质改变的基因变异数量超过了7000万种,其中仅约0.1%的变异在临床变异数据库中被注释,其余变异的临床意义并不明确。人类基因变异的罕见性使得破译个人基因组的进展缓慢。
灵长类动物与人类的亲缘关系最为接近,例如,黑猩猩和人类的蛋白质序列相似度高达99.4%,这表明在黑猩猩中发现的蛋白质变异很可能在人类中具有同样或接近的效果。研究人员想到,可以通过对灵长类动物群体的测序研究来系统地分析常见变异,这些常见的变异在灵长类中很可能是无害或者低害的。“某些突变在灵长类中普遍存在时,我们认为它对人类的致病性可能没那么强。”周龙解释。
基因测序巨头Illumina人工智能实验室的首席研究员凯尔·凯-豪·法尔(Kyle Kai-How Farh)领导的联合研究团队基于前述809个灵长类个体基因组鉴定出了人类直系同源蛋白上430万个可能导致蛋白结构变化的基因变异位点,加入人类疾病基因数据后,训练了PrimateAI-3D的人工智能神经网络以识别和前瞻性地判断人类可能出现的基因突变并预测是否可能为良性突变。
相关论文题为《人类和灵长类群体中可容忍的遗传变异景观》(人类和灵长类群体中可容忍的遗传变异景观)。
基于PrimateAI-3D人工智能神经网络,该研究团队还开发了通过罕见突变预测人类患病风险的方法,其提出了一种罕见变异的多基因风险评分(polygenic risk score,PRS)系统,并使用UK Biobank的数据,构建了罕见变异PRS模型,可识别高风险患病个体。
研究发现常见变异和罕见变异在预测人类疾病风险方面具有互补的效用,即常见突变可以平均识别出更多可能患病的个体,而罕见变异更容易识别出最高风险的异常个体,这对于预防性筛查具有重要意义。
相关论文题为《罕见渗透性突变给常见疾病带来严重的风险》(Rare penetrant mutations confer severe risk of common diseases)。
研究更广泛物种基因组,寻找人类特异基因
据了解,灵长类基因组计划由张国捷教授和吴东东研究员于2019年提出和发起,随后,西班牙庞培法布拉大学的托马斯·马奎斯-博内特(Tomàs Marquès-Bonet)教授在此计划基础上组织了群体遗传学研究。
灵长类基因组计划的研究联盟包括浙江大学生命演化研究中心张国捷教授团队、中国科学院昆明动物所吴东东研究员团队、西北大学生命科学学院齐晓光教授团队、云南大学生命科学学院于黎研究员团队、西班牙庞培法布拉大学联合演化生物学研究所Tomàs Marquès-Bonet教授团队、Illumina人工智能实验室、美国贝勒医学院人类基因组测序中心Jeffrey Rogers教授团队、丹麦奥胡斯大学Mikkel H. Schierup团队,以及德国莱布尼茨灵长类研究所Christian Roos教授团队。
张国捷告诉澎湃科技,他们希望通过灵长类基因组计划对不同灵长类物种的基因组比较来研究灵长类物种起源的机制,基因组的演变与大脑等复杂性状的关联,以及人类基因及变异的起源和演变规律。
“研究灵长类演化的过程和与近缘物种的基因组比较可以告诉我们哪些DNA序列是真正人类特异的,这些人类特异的DNA序列往往对人类独特性状的出现和正常发育发挥了重要作用。另一方面,我们还可以知道哪些DNA序列是人类和其他物种共有的,甚至在长期的演化过程中,由于发挥了非常重要的作用,在过去几千万年的演化历史几乎没有发生任何变化。而这些序列一旦在现代人里出现变异,往往会导致疾病或者不良表型。”张国捷说。
这一领域的难点在哪? “和人类一样,灵长类基因组有接近30亿个碱基,2万多个基因,每个碱基、每个基因都有自身的演变过程。物种分化的过程并非一分为二的简单过程,如果把所有不同基因组区域的演变过程汇总起来,可以看到物种变化的过程其实是DNA信息不断交换,古老的遗传信息被新物种继承,同时新物种积累新的遗传变异,最终形成DNA信息的变化网络。” 张国捷向澎湃科技表示,如何在复杂交织的基因网络里找到可能导致重要节点关键形状产生的关键变异,是一项很有挑战的工作。
张国捷表示,下一阶段,灵长类基因组计划有两个研究方向,一是希望对更广泛的物种进行基因组研究,进一步解释物种的起源规律和不同类群之间表型性状、生理结构、生活史差异的遗传基础。“全世界现存500多个灵长类物种,目前我们只对其中1/10的物种开展了基因组学研究。”二是希望进一步从功能机制上研究基因组的差异如何引起表型的差异,揭示在历史上基因组哪些关键变化影响了人类特异性的表型的出现。