本期解读嘉宾:袁老师 哈佛大学医学院脑科学博士后 哈佛大学附属BWH脑科学专家 小小神经元首席脑科学家 《自然》(Nature)是世界上历史悠久的、最有名望的科学杂志之一。与当今大多数科学杂志专注于一个特殊的领域不同,它是少数依然发表来自众多科学领域一手研究论文的杂志(其它类似的杂志有《科学》和《美国科学院学报》等)。在众多科学研究领域中,诸多最重要、最前沿的研究结果都是以短讯的形式发表在《自然》上。《自然》的主要读者是从事研究工作的科学家,但杂志前部的文章概括使得一般公众也能理解杂志内最重要的文章。杂志开始部分的社论、新闻、专题文章报道科学家一般关心的事物,包括最新消息、研究资助、商业情况、科学道德和研究突破等栏目。杂志也介绍与科学研究有关的书籍和艺术。杂志的其余部分主要是研究论文,这些论文往往非常新颖,且有很高的科技价值。 本文涉及专业内容,阅读难度较大,家长们可选择标出的重点内容进行浏览 研究团队介绍 KirkE。Lohmueller教授 KirkE。Lohmueller教授 美国加州大学洛杉矶分校(UCLA)的KirkE。Lohmueller教授课题组是一个生物计算机团队,主要和各大顶级生物实验团队合作,同时也采用分析目前已知公共数据库的方式,来解决生物学问题。Kirk教授的研究长期聚焦于DNA突变数据分析,尤其是在人类遗传疾病上。 美国加州大学圣地亚哥分校(UCSD)的MelissaGymrek教授课题组致力于了解人类疾病背后的复杂基因变异。他们特别感兴趣的重复DNA变种称为短串联重复(STR)作为复杂变异的模型。其实验室研究重点是开发计算工具,用于分析大规模测序数据的复杂变异,并应用这些工具了解重复变异对人类疾病的贡献,和如何影响基因调控和其他复杂特征。 KirkE。Lohmueller教授课题组所属的美国加州大学洛杉矶分校(UCLA)和MelissaGymrek教授课题组所属的美国加州大学圣地亚哥分校(UCSD)都属于加利福尼亚大学(UniversityofCalifornia),简称加州大学。加州大学是由美国加利福尼亚州的10所公立大学组成的大学行政系统,是世界上最具影响力的公立大学系统,被誉为公立高等教育的典范。 研究内容及成果 基因组中的重复序列可以按照序列特征分成两类,第一类是分散分布在基因组中的重复序列(interspersedrepeats,IRs),第二类则是串联重复序列(tandemrepeats,TRs)。其中第一类主要是转位基因transposableelements(TEs),它能在DNA分子中移动,不断改变其在基因组中的位置,从一个基因组移到另一个基因组中。第二类串联重复则包含微卫星基因microsatellites(16个碱基为一个重复单元)和小卫星基因minisatellites(1060个碱基的长序列为一个重复单元)。 为了研究方便,在本研究中,研究人员定义了120个碱基长度的重复序列,其是富含新生突变的主要序列来源之一。 首先,研究人员利用目前最大的孤独症数据库SimonsSimplexCollection(SSC)的数据,找到1637个单纯型家族测序的外显子测序结果,进行了全基因组范围的新生突变TRs分析,而该库聚集了已报道会有携带先前未鉴定的、致病性新生突变的先证者。 接着研究人员使用GangSTR软件对串联重复序列进行基因组分型,经过数据筛选以排除潜在的错误鉴定,研究人员总计在1593个家族的94616个不同位点上鉴定到175291个高度可信的TRs新生突变。这些数据,最后输入到研究人员开发的MonSTR软件中进行后续分析。这套分析鉴定系统比目前已有软件的可信度更高,具有约90(4449)可验证比例。 经过数据分析,平均每个儿童有53。9个突变。突变数目还和父系的年龄具有一定相关性(pearson’r0。19),而根据已有报道,子代的新生突变TRs有74来源于父系。 图1 进一步研究发现,这些新生突变TRs有71倾向于扩张(重复序列增加),而仅有29倾向于收缩(重复序列减少)。这些倾向于扩张的新生突变TRs主要来源于母系,来源于父系的新生突变TRs正好倾向于扩张和收缩各50。同时,母系新生突变TRs的重复碱基拷贝数显著增加,且这个现象在所有长度的新生突变TRs上均能重现。 此外,与前人报道一致,研究人员也发现了较长的基因更有可能经历收缩,较短的基因更有可能经历扩张这个现象。 图2 那么,在孤独症患者中,是否存在新生突变TRs的特殊情形呢?研究人员对孤独症患者子代和其未患孤独症的亲兄弟姐妹数据进行了分析。 分析结果发现,孤独症患者平均有54。65个新生突变TRs,显著高于其兄弟姐妹(平均53。05个突变),同时有更多的重复碱基拷贝数增加。由于无法得知富含新生突变TRs的基因组信息,作为替代,研究人员接下来使用基因组注释信息,进行了后续分析生物功能的相关研究。 与非孤独症的兄弟姐妹们相比,孤独症患者在其胎儿期的大脑中表达更多的新生突变TRs,且该差异主要位于基因序列的启动子(promoter)和加强子(enhancer)上。而这些多出来的突变,很有可能会改变其基因序列相邻的基因表达,从而对个体产生显著影响。 孤独症患者84的新生突变TRs也同样存在于其同胞兄弟姐妹们中,这意味着可能只有16的小部分突变具有孤独症致病性。 更进一步的研究发现,当我们根据突变等位基因频率对突变频率进行分层分析时,我们发现孤独症患者的突变过度增加会导致更稀有等位基因的突变,在之前未观察到的等位基因中效果最强,形成连锁反应。 图3 最后,研究人员试图根据预测的基因致病功能来确定新生突变TRs的优先级。为此,研究人员基于群体遗传学框架开发了一个名为SISTER(selectioninferenceatshortTRs)的软件,来权衡单个新生突变TR的负向选择。该模型包含变异、遗传漂变和负向自然选择,它可以利用等位基因的频率数据来推断个体选择系数的后验概率。 通过该软件,研究人员对孤独症患者及其同胞进行分析测序,共鉴定到了35个突变,其中25个位于孤独症患者,且来源于之前未发现的等位基因,预计具有极强的致病性。其中多个点突变已被报道与孤独症相关,如PDCD1、KCNB1、AGO1、CACNA2D3、FOXP1、RFX3和MED13L基因等。而在未患孤独症的同胞中,仅发现了2个突变与孤独症相关。 以上结果表明,在最严格条件选择下,罕见等位基因的新生突变TRs子集具有最强的孤独症致病性。 图4 未来研究方向 早在2000年6月,中、美、日、德、法、英等6国科学家便共同完成了人类基因组草图,对约31。6亿个DNA碱基对完成了测序,是人类探索自身奥秘上的一个重要里程碑。 然而,即便今天已经对我们自身所有DNA信息有了足够了解,我们仍然无法做到对疾病的防治。其中一个原因就是每个人的基因都是独一无二,除了遗传突变继承父母外,还有一个原因是新生突变可能随时在体内进行着,并对机体产生不同程度的影响。因而,如何能在这么多基因数据中找到关键信息,是一个非常大的挑战。 在本项研究中,研究人员识别并广泛鉴定了长久来被人忽视的串联重复序列上新生突变,并进一步描述其在孤独症上的重要病理意义。虽然从某种意义上说,生物信息分析结果必须得到严格的实验证实,才足以令人信服,但该研究展现的大数据分析方式值得广大研究者们参考。 据美疾控中心2020年的报告,美国孤独症的发病率已高达154,这是什么概念呢?相当于在一节高峰时期的地铁车厢内就可能有一位孤独症患者。 而目前中国有超过1000万的孤独症患者,其中12岁以下的患者约有300多万,这并不意味着我们的发病率低,而可能是很大一部分患者连诊断的机会也没有。 孤独症不再是一种罕见病,所以面对孤独症无法医治的现状,科学家们也在锲而不舍地进行研究,每一项研究的进展都在拉近我们和星星的距离。 我们会将这些国际上最新的研究成果分享给大家,以科学的态度看待孤独症,不轻信没有科学证明的所谓能治好孤独症的药物或是治疗方式。 如果你想学习更多科学干预的方式,欢迎加入我们的孤独症家庭公益群,不仅有800位家长交流心得经验,更有哈佛老师、BCBA每日答疑解惑 参考文献 〔1〕Mitra,I。,Huang,B。,Mousavi,N。etal。Patternsofdenovotandemrepeatmutationsandtheirroleinautism。Nature589,246250(2021)。doi:10。1038s41586020030787