10年前的今天,大型国际科研合作项目“千人基因组计划”协作组在国际顶级学术期刊《自然》上发布了基于1092个个体的DNA变异分析,构建的人类基因组遗传变异整合图谱。这也是科学界首次实现千人规模以上的基因组对比分析,标志着人类基因研究进入了一个划时代的新阶段。
图源:Nature官网截图
千人基因组计划是人类基因组计划的延续和发展,也是基因组科学研究向临床医学迈进的重要转折点。深圳华大生命科学研究院、英国Sanger研究所和美国国立人类基因组研究所是千人基因组计划的主要发起者和承担者。对华大而言,千人基因组计划是从个人基因组研究到大人群基因组研究的一个关键转折点。
今天,在这个划时代的成果发表10周年之际,我们邀请到华大生命科学研究院院长徐讯,讲述千人基因组计划发起的缘由、带来的影响以及生命科学的未来展望。
*下文根据徐讯院长演讲内容整理
20多年前,第一个人的基因组测序花了38亿美元,今天单人基因组测序的成本只要几百美元。这中间上百万倍的变化,带来了一个产业的变革。这也是为什么人类基因组测序在当年被认为是一个挑战性的工程,而今天却变成了一个在临床诊断、科研当中常用的工具。
大家如果去看顶级的综合性科学杂志,会发现生命科学是过去20年里篇幅最重的领域之一,而基因组学又是生命科学里最热门的。下一个20年,我们相信基因组学依然会非常热门,因为生命科学的底层问题还是要继续解决,而这些问题又依赖于基因组学这样一个基础科学的发展。
从第一个个人基因组到人人基因组时代
1990年正式启动的人类基因组计划是测一个人的基因组。通过这个项目,我们知道了人类很多关键的蛋白质和决定蛋白质的基因,并基于这些数据,进一步解决了很多疾病和疾病治疗药物的问题。
但是,随着研究的深入,我们发现很多常见疾病是难以解释的。从糖尿病这种常见病来看,原来有一个假说是:“常见病一定是由常见的突变决定的”,所以之前大家瞄准人群里的常见突变。而其实,这些疾病可能是由多个基因决定的,于是,产生了一个技术——全基因组关联分析,目的就是通过研究人类基因组上频率超过 5% 的突变,来解释这些常见疾病。但后来发现,通过大量的人群研究找出来的关键基因和高频突变,最终只能解释人群里糖尿病遗传性的 20%,还有 80% 的遗传性是解释不了的。
那么,如果不是人群的高频突变,又是什么决定了这些常见疾病呢?实际上,我们每个人都携带了大量的罕见突变,这些突变都不是常见的。为了研究这些罕见突变具有什么样的意义,华大和英国、美国的科学家共同启动了千人基因组计划。
“千人基因组计划”发布了迄今最详尽的人类基因多态性图谱,成果以封面文章形式发表于《自然》杂志
千人基因组计划有一个重要的发现——大量个人特异的罕见突变都是轻微有害的。所谓轻微有害,就是指如果只有一个突变,很可能不会引起显著的疾病现象,但是当这些轻微有害的突变聚集,最后很可能就会导致一些常见的疾病,比如糖尿病。
因此,千人基因组计划给了人类一个启示:疾病的研究不能只做几个常见的突变,而要盯住群体里出现的低频突变,这些突变共同决定了人类的常见病。也就是在这个基础上,才有了百万基因组计划,才有了英国发起的Genome England,美国发起的All of Us和中国发起的精准医学计划。这就是从第一个人类基因组到千人基因组,再到今天的人人基因组背后的科学逻辑。
单细胞测序:为生命科学研究提供新工具
科学发现背后的驱动力是工具的发现,有了工具,我们才能够有观察数据的新角度和方法,才会有新的认知。
原来我们通过显微镜等方式,只能认识100多种细胞,但是要行使人体这么复杂的功能,细胞的种类可能远远超过100这个数量级。单细胞测序的出现,为人类观察细胞带来了全新的视角,也就有了人类细胞图谱(Human Cell Atlas,HCA)计划这个全球影响力非常大的项目,这个计划的目的就是通过单细胞测序等新型工具,重新对细胞进行分类。
HCA这个项目进行四五年了,在这个过程当中产生了很多新的发现,鉴定出很多以前从未报道过的细胞类型,而且这些细胞类型在人体里起着非常重要的作用。过去大家认为人体大概有300种主要的细胞类型,但实际上,人的细胞类型往往比想象中的更复杂。
华大是从2010年开始做单细胞方法的开发,过去10多年,我们经历了一个漫长的技术发展历程。2012年,我们用单细胞测序的方式做了14个细胞,在同一期《细胞》杂志上发表了两篇文章;今天我们在做单细胞测序的时候,每个项目可能都是数十万,甚至到百万级别的细胞量。
正是凭借单细胞测序等新工具,我们可以重点关注发育、脑科学、疾病等方面的问题。今年以来,华大在这几个方向也都取得了一些新进展。
为了更好地解释人类细胞的功能,我们选择了研究非人灵长类动物食蟹猴,把食蟹猴的所有器官都做了单细胞测序,绘制了全球首个非人灵长类动物全细胞图谱,通过这样的数据和人的细胞类型进行对比。这个成果于2022年4月发表在《自然》期刊。
脑认知方面,我们构建了蚂蚁的大脑细胞图谱。蚂蚁的研究项目很有意思,这是一个有社会分工的物种,虽然工蚁、雄蚁、繁殖蚁、蚁后的基因组差别不大,但是它们的社会分工是不一样的,那这是不是由基因组决定的呢?通过单细胞测序,我们发现,相比雄蚁和蚁后,工蚁的大脑里缺少一种细胞类型,而这个细胞类型恰恰是控制生殖行为的。这就决定了工蚁只能工作,不能够参与生殖后代。所以说,单细胞的研究能够为很多生物学现象提供新的机制解释的途径。
近10年来,得益于工具的不断突破和发展,单细胞领域的数据量呈现出几何式快速增长的现象。单细胞测序通量的快速提升和成本的快速下降,也促使单细胞方法在过去5年左右,在整个生命科学研究领域得到了快速发展。
时空组学:开启生命科学领域第三次科技革命
当然,单细胞测序也存在一定的不足。因为单细胞测序需要做组织的解离,而解离后的细胞失去了空间位置信息,当我们看到一群特异的细胞类型时,没法解释它们是干什么的。所以,真正进行生物学问题的解释就得回到结构上来,这就是为什么我们需要时空组学。
生命科学的发展史上,显微镜的发明开启了整个生命科学发展的重大机遇,是人类在认知自身、认知生命过程中的一个重大转折点。有了显微镜,我们才能观察到生命最基本的单元——细胞,认识到有不同的细胞类型,认识到有细菌这个物种的存在。
2001年,人类基因组框架图绘制完成并发表,是整个生命科学领域的第二个转折点。自此,大家可以从分子层面去解释生命的现象,才有了今天的精准医学、癌症治疗的靶向药物。包括对抗新冠,也是因为有了基因组技术,才能第一时间对它进行测序分析,发现它是一个冠状病毒。
但是,显微镜观察生命结构是只有形态,没有分子层面、机制层面的解释;DNA测序技术则是只有分子信息,没有结构信息。时空组学则同时把结构和分子功能整合到了一起,这也是人类在认知生命上第一次把结构和功能进行整合。因此,我们将时空组学技术称为生命科学领域的第三次科技革命。
今年5月,基于自主研发的时空组学技术Stereo-seq,华大联合多家机构在细胞出版社官网发布了全球首批生命时空图谱,其中,小鼠胚胎发育时空图谱相关成果以封面文章的形式发表于《细胞》。这是首次实现从时间和空间维度上对生命发育过程中的基因和细胞变化过程进行超高精度解析。
9月,华大联合广东省人民医院、武汉大学等机构构建了全球首个高分辨的蝾螈脑再生时空图谱,以背靠背封面文章的形式发表于《科学》。基于华大的时空组学技术,研究团队找到了蝾螈脑再生过程中的关键神经干细胞亚群,描绘了此类干细胞亚群重构损伤神经元的过程,同时还发现脑再生与发育过程具有一定的相似性,为认知脑结构和发育过程提供助力,为神经系统的再生医学研究和治疗提供新的方向。
毋庸置疑,时空组学将为生命科技产业带来革命性的突破,包括认知与工程化。认知上,我们将通过时空组学技术,重新认知生命结构、重新定义疾病、重新认知个体发育、重新认知物种起源。此外,为了推动时空组学技术在生命科学各个领域的广泛应用,华大研究院等机构在今年5月共同发起了国际化科学组织——时空组学联盟。
时空组学联盟成立
20多年前的人类基因组计划也是一个国际联盟,当时有6个国家的科学家参与其中。这个计划启动的一个核心契机就是测序技术的发展,它的目标就是为了破译单个人的基因组密码,后来带来了生命科学的蓬勃发展。
可以说,人类基因组计划之后,这种大科学联盟的方式是全球生命科学领域产生重大进展的关键,它不仅加强了国际科学交流,也推动了科学的不断进步。
今天,时空组学联盟已经有来自30个国家的近150位科学家参与其中,这些成员是一群顶级的科学家,不仅包括生物学家,还有数学家、计算机学家等。这是多国家、多学科、多领域的合作。我们希望,通过大科学工程和全球合作,借助时空组学技术来解析生命的结构,一起推动人类终极问题的回答。我们也相信,时空组学联盟必将推进人类对疾病和自身生命的认知,为生命科学领域带来更多重大的科学突破。