华大资讯 关注更多 科研与教育 关注更多 产业进展 关注更多 媒体报道 关注更多
联系我们

华大基因(总部)

电话:400-605-6655(临床业务咨询)

400-706-6615(科技服务咨询)

+86-755-36307888(前台

媒体联系

电话:+86-755-36307212 

邮箱:media@genomics.cn 
0
大数据杂志《GigaScience》正式发刊,实现文章与数据结合的创新学术发表模式
发布日期: 2012-07-12

2012712日,华大基因和生物医学中心(BioMed Central)宣布其共同创办的生物学期刊《GigaScience》首刊正式发行。该期刊采用标准全文文献、数据库信息以及信息分析工具相结合的崭新模式,来发表大规模的生物学研究成果,为广大科研工作者提供免费公开的有效数据以及生物学发现等资源。《GigaScience》的正式发行是传统期刊出版业迈向数据全面公开与共享的重要一步,有助于实现科研人员对数据资源最大可能的合理利用,提高数据密集型科研项目的再现性。

GigaScience》杂志这种全新的出版模式使读者不仅可以着眼于文献中所得到的科学结论,还可直接通过文献所提供的数据和分析工具对结果进行测试和验证,实现了数据的透明、公开及再现性,为克服目前研究成果普遍缺乏可重复性的问题提供了一条很好的解决途径,同时对充分挖掘数据的生物学价值也具有十分重要的意义。与《GigaScience》杂志相结合的大型数据库GigaDBhttp://GigaDB.org)已采用数字对象唯一标识符(DOIs)对杂志数据库中的所有数据进行标识,使数据保存更加永久,实现可追踪、可检索、可链接、可引用,而之前这些功能仅能用于学术文献。实现数据的可引用性,可以使提供和分享这些数据的研究人员为他们所做出的科研成果获得更应有的认可。

以本期中英国伦敦大学学院(University College LondonStephan Beck教授领导的研究小组的研究论文(http://goo.gl/2nZgD)为例来说明《GigaScience》和GigaDB数据库在出版方面所进行的革新性举措。这篇文章聚焦于DNA甲基化的全基因组分析。文章包含了所有的支撑数据和重现该实验所需的软件工具,共84GB数据量,均可从GigaDB上免费获取及使用。依托华大基因的数据存储能力,《GigaScience》完全能够有效管理这些远超过其他任何期刊所能出版管理的数据信息容量。此外,GigaDB将进一步通过采用零版权声明的方式来放弃所有数据信息的版权,以支持数据的完全公开访问与便捷获取。

主编Laurie Goodman指出:“目前,海量数据的使用能力远远落后于数据的产出能力。华大基因的领导者们首先意识到创办这种全新期刊的必要性,通过华大基因强大的计算信息资源,可以使海量数据信息得以存储及管理,并使数据资源可直接被链接及引用到科研论文中。此外,通过在数据平台中涵盖分析工具,以及下半年将增加的强大云计算技术,《GigaScience》将能够把数据信息直接共享给缺乏强大计算资源但需要最优数据的研究人员。这也和我们的合作出版方BioMed Central的目标是一致的,从而使得我们在这项计划中成为彼此最佳的合作伙伴。”

在这种大数据导向的创新发表模式下,《GigaScience》还将发表综述和评论文章,对未来更好的处理大数据所面临的挑战和困难提出见解。

本期《GigaScience》亮点文章:

1DNA 压缩存储

英国茵格斯顿的欧洲分子生物学实验室(EMBL)生物信息研究中心的研究人员指出,要做到DNA序列信息的可持续存档,需要明白数据的产生或者保存都会存在差异。他们在数据易于复制和有DNA样品进行重测序的基础上,提出了一种使用的不同级别数据压缩的分级系统来存储DNA序列。

Cochrane, Cook and Birney. The future of DNA sequence archiving. GigaScience 2012, 1:2.
http://www.ebi.ac.uk/ena/sites/ebi.ac.uk.ena/files/documents/cochrane_140212.pdf

2、病菌监测数字化

随着基因组技术的快速发展及其在过去二十年中的深入应用,使得其成为公共卫生领域取得重大进展的基础工作。冷泉港实验室和美国马里兰大学的研究人员表示,现在正是建立基于测序的病原体监测系统的最佳时刻。他们认为该系统建立的最大瓶颈并非所需的技术,而是对于数据共享的科学态度。

Schatz and Phillippy. The rise of a digital immune system. GigaScience 2012, 1:4.
https://docs.google.com/open?id=0BwQ3jvDcrUR6V0IwcFZOWXVfWGM

3、生态多样性数字化计划

基因组观测网(Genomic Observatories Network)计划将特定研究热点的全生态系统数字化,以便更好的预测生物多样性动态模型。在这篇文章,作为该项长期计划的主导方,英美两国科学家描绘了如何收集和利用如此巨大的遗传变异数据库,以便更好的服务于科学研究和社会发展。

Davies et al. A Call for an International Network of Genomic Observatories (GOs). GigaScience 2012, 1:5.
https://docs.google.com/open?id=0BwQ3jvDcrUR6WDV6UGktMVdYb1E

4、在首刊的结尾,Jonathan Eisen讨论了“组学”词汇,以及如何区分好与坏。

Eisen J. Badomics words and the power and peril of the ome-meme. GigaScience 2012, 1:6
https://docs.google.com/open?id=0BwQ3jvDcrUR6QmU4R2lKcXJERlE