以实现超大规模生物信息学计算为中心任务,不断提升其在高效能计算、云计算服务能力,为海量数据处理提供创新解决方案。

华大基因拥有深圳、香港、北京、武汉、杭州等数个大型生物信息学超级计算中心,总峰值计算能力达到631.27 T flops, 总内存容量达到187.76 TB,总存储能力达到88.5 PB(截至2017年3月)其中位于深圳和香港的集群的峰值计算能力分列国内生物信息领域第一和第二位,有能力为海量生物信息学数据的存储、处理和分析提供稳定而高效的资源保障。下表所示为华大基因在中国各地所部属的超级计算集群及对应性能。

Site

CPU Cores

Memory(TB)

Storage(PB)

T flops 

Shenzhen

33,896

149.54

66.4

456.97

Hong Kong

8,336

12

14.47

93

Beijing

300

0.5

0.5

1.5

Wuhan

4,944

19.9

5.33

54

Tianjin

632

2.42

0.65

14.2

CHOPS

300

0.8

0.5

2

Denmark

920

2.6

0.65

9.6

Total

49,328

187.76

88.5

631.27

华大基因现有大型计算集群运算存储能力一览表 

随着基因研究技术进步,生物信息数据的存储计算需求每1218个月就会增长10倍,远远高于摩尔定律提供的参考数值。在生物信息大爆炸的宏观背景下,华大基因对计算硬件资源的投入也在不断攀升。2014年,华大基因第一个超过1PFLOPS计算能力的超级计算集群将正式投入使用。届时,该集群将成为国内乃至国际生物信息学界新的性能标杆。 

 华大基因已具备全球领先的超大规模生物信息计算与分析能力,除此之外还与最快的超级计算机天河一号所在的国家超算天津中心合作,成立了天河——华大生物信息计算联合实验室,依托国家超级计算中心,在滨海新区打造国际领先的基因数据计算及研发北方基地。此次合作双方将从高性能计算应用研发领域入手,对现有生物信息计算软件分析流程优化,发挥天河一号的计算能力,针对海量数据的储存和处理,开发出高质量的生物信息学计算分析工具,快速求解各类需要大量计算的生物信息难题,从海量生物信息数据中挖掘出各种生命现象的内在规律。

   

         “天河一号TH-1A)超级计算机                       天河天腾(TH-1)系统