EN

业务相关咨询电话:

临床检测:400-605-6655
科研服务:400-706-6615
司法服务:400-900-2616
测序仪器:400-096-6988

前台电话:+86-755-36307888

传真:+86-755-36307273
客服邮箱:info@genomics.cn
媒体联络:media@genomics.cn
地址:深圳市盐田区北山工业区11栋(518083)

    新闻中心

新闻中心

及时播报华大科研、教育、产业等方面的相关资讯

首页 华大概况 新闻中心 集团动态 病毒还能促进肠道健康?华大高质量盘点,解读肠道病毒组数据库前沿

病毒还能促进肠道健康?华大高质量盘点,解读肠道病毒组数据库前沿

发布日期:2022/07/14

近年来,肠道微生物正在逐渐走进大众视野,益生菌等肠道菌群也已被证实对人体健康起到了许多正面作用。但是,你听说过肠道中的病毒吗?

病毒是地球上数量最多的生物实体,在人类肠道环境中也不例外。

悄悄告诉你,我们排出的每克粪便中就包含了大约10-100亿个肠道病毒哦

不同于新冠病毒,肠道病毒会伴随我们整个生命周期。而且,并不是所有肠道病毒对人体都有害,大部分肠道病毒与人类和谐共生,在维持微生态稳定和人体健康方面可能具有大大的作用~

病毒能促进肠道健康?华大高质量盘点,解读肠道病毒组数据库前沿

与你和平共处的肠道微生物,包括细菌、真菌、病毒……

然而,目前人们对于肠道病毒种类和组成的认识还十分有限,这制约了研究者进一步探究肠道病毒与人体疾病健康的关联。肠道病毒组因此被称作肠道中的“暗物质”。

得益于宏基因组测序数据的积累和生信工具的进步,近年来已有四个高质量的人肠道病毒组数据库陆续公开发表。这些数据库极大刷新了我们对人肠道病毒多样性的认知,为研究者们提供了丰富的肠道病毒参考数据集。

四个高质量的人肠道病毒组数据库

  • Gregory等人基于2,697个人肠道宏基因组测序样品构建了GVD数据库,其中包括33,242个肠道病毒物种,展现了病毒多样性在健康西方人群不同年龄层的变化特征;
  • Tisza团队基于5,996个来自人体多个部位的宏基因组测序样本,建立了CHVD数据库,其中包含45,033个肠道病毒物种,揭示了超过2200种病毒类群与多种慢性疾病关联;
  • Nayfach等人基于11,810个人肠道宏基因组测序样品构建了MGV数据库,其中包含54,118个肠道病毒物种,发掘了肠道病毒的潜在功能,有助于理解病毒与宿主的动态相互作用;
  • Camarillo-Guerrero团队基于28,060人类肠道宏基因组构建了GPD数据库,其中包括142,809个肠道病毒物种,发现了病毒与特定的细菌宿主之间的联系,揭示了世界各地人群的肠道病毒组的特征。

为了直观有效地呈现各个数据库的特点、方便研究者们选择合适的数据库及参考数据库构建流程,深圳华大生命科学研究院近日在国际学术期刊Cell Host & Microbe上发表了一篇综述文章,基于近两年发表的人肠道病毒组数据库,系统总结了各个数据库的样本规模、样本地域组成、发现的病毒数量等信息,为后续研究的数据库选择提供了重要参考;同时,通过比较各个病毒组数据库的构建过程,总结出一套基于肠道宏基因组数据构建肠道病毒组数据库的“最佳实践”流程,对从头构建或者更新病毒数据库具有重要的指导意义。

病毒能促进肠道健康?华大高质量盘点,解读肠道病毒组数据库前沿

Cell Host & Microbe 官网截图

01 如何选择合适的肠道病毒组数据库?

◆ 完美的肠道病毒组数据库尚不存在

从数据库规模来讲,GPD是目前包含病毒种类最多的数据库,然而,不同数据库的病毒种类随着样本量增加而增加,且尚未趋于平稳。当前的肠道病毒组数据库尚未达到饱和,增加样本量仍有望发现更多病毒种类。

而通过分析公开发表的四个病毒组数据库的源数据集,研究团队发现源数据集之间的共用情况远低于预期,表明不同数据库具有一定的独特性。MGV和GPD倾向于仅采用宏基因组测序数据,而GVD则包含了更多的病毒颗粒富集的源数据集,对低丰度病毒以及游离病毒等可能更具代表性。

◆ 数据库你选“对”了吗?

根据之前的研究报道,肠道病毒组成存在地区特异性。研究团队详细总结了四个病毒组数据库源样本的地域组成,发现来自欧洲、北美洲和亚洲的样本在四个数据库中均占主导,而来自非洲和南美洲的样本量明显不足。

这反映上述数据库对欧洲、亚洲、北美洲地区人群均有一定代表性,可综合样本规模、病毒种类、测序数据类型等选择合适的数据库;此外,GPD包含了最多的来自大洋洲的样本,对于大洋洲地区病毒组特征可能更具代表性;另需关注的是,非洲、南美洲人群的肠道病毒多样性可能是被低估的,后续研究可考虑采集更多该地区的样本。在实际选择合适的病毒组数据库时,应当考虑数据库对于目标研究人群的代表性。

02 手把手教你从头构建数据库

上述四个肠道病毒组数据库已经为从头构建数据库提供了良好的示范,但不同数据库采用的工具和构建流程仍存在差异。研究团队通过对比不同数据库的构建流程,各取所长,总结出了包括宏基因组组装、病毒识别、质控、病毒分类和宿主预测的“最佳实践”流程。

具体而言,在宏基因组组装、病毒识别、质量控制方面,四个数据库已基本达成共识。首先使用megahit或metaSPAdes进行宏基因组测序数据的从头组装,然后综合多个基于不同病毒组特征的病毒序列鉴定方法进行病毒的识别,再从两个方面进行质量的控制,包括去除细菌等污染序列和评估病毒基因组完整性等。

在病毒分类方面,由于目前大量病毒尚未被分离培养,基于已知病毒分类数据库对上述肠道病毒数据库中的病毒基因组进行物种分类的效果并不理想。通过现有研究实践表明,基于病毒基因组间共有基因数量等特征来评估病毒的系统发育关系,可能是实施新病毒分类的有效方案。

在病毒宿主预测方面,有两类方法,一种是通过CRISPR Spacer序列比对的策略,识别噬菌体宿主,这种依赖序列比对的方法准确性高但灵敏度低,在这种策略中,CRISPR Spacer数据库的完整性和比对参数选择至关重要。而另一种不依赖比对的工具,如WIsH等,可能增加宿主预测的百分比,但准确度相对较低。将两种方法结合可能达到理想效果:在不影响准确性的情况下,提高预测的灵敏度。

03 挑战?机遇!

综上,这些最近发表的大规模人类肠道病毒组研究显著地提高了我们对肠道病毒组组成和变化的理解,有助于未来研究者开展一系列人类疾病与肠道病毒组的关联研究。本综述论文不仅向研究人员阐明了肠道病毒组数据库的特征,还综合各个研究的优势、提出了“最佳实践法”,为从头构建肠道病毒组提供了指导性意见。

构建人肠道病毒组数据库仅仅是探究肠道病毒组奥秘的开始,未来仍面临许多亟待解决的问题。譬如,可行且稳健的研究病毒系统发育关系的方法仍待提出,特别是在属和科的分类水平;在宿主识别方面需要更多的工作来改进机器学习模型和输入特征,以开发出预测精度更高的工具;未来还需要开发更多专门用于病毒组研究的分析工具,探究肠道病毒与人类健康的关系。华大研究团队将为克服以上困难付诸持续的努力、朝着解密“肠道暗物质”的方向砥砺前行。

深圳华大生命科学研究院李俊桦研究员、杨芳明博士、肖敏凤副研究员为本综述论文共同第一作者,中国科学院大学研一学生李艾欣为署名作者。该项目得到国家重点研发计划(2020YFA0908700)基金支持。


原文链接:

https://www.cell.com/cell-host-microbe/fulltext/S1931-3128(22)00308-0?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS1931312822003080%3Fshowall%3Dtrue