利用基于Intel® Enterprise Edition for Lustre* software的高性价比 … ·...

4
成功案例 利用基于Intel® Enterprise Edition for Lustre* software的高性价比存储解决 方案加速挖掘基因信息价值 英特尔®至强®处理器E5-2650 v3系列 Intel® Enterprise Edition for Lustre* software 生命科学 存储 利用基因信息挖掘生命现象的内在规律,不但可以为人类预防疾病提供帮助,更是 人类不断探索生命奥秘的基石。作为全球最大的基因组学研发机构,华大基因*, 为应对日均10TB的基因数据增长和不断提升的数据读写性能等需求对存储系统 的挑战,部署了基于Intel® Enterprise Edition for Lustre* software,由超微公司* 提供的基于软件定义的开放存储系统,以更低的成本实现了显著的数据吞吐性能提升,加 速挖掘基因测序数据价值的进程,并满足未来不断增长的数据存储需求。 面临挑战 • 提高数据读写性能: 现有存储系统提供400MiB/s的数据吞吐能力,已无法满足华大基因* 用于基因信息科学研究的高性能计算集群对数据吞吐性能的需求。 • 降低存储系统成本: 面对日均10Tb的基因测序数据增长,华大基因*需要成本更低、存储 密度更大的存储解决方案。 • 增强系统扩展能力: 华大基因*急需扩展更灵活的存储系统,面对未来不断复杂的基因研 究对容量和性能的扩展性挑战。 解决方案 • 基于Lustre*的存储方案: 华大基因*为其位于武汉的数据中心部署了该解决方案。方 案基于英特尔®至强®处理器E5-2650 v3的超微*服务器,2台超微*6028R-E1CR12N 服务器用于Lustre*元数据存储(MDS),1台配备15块600GB容量硬盘和2块200GB 容量固态盘的超微*CSE-216BE26-R920LPB服务器用于Lustre*对象存储目标 (MDT),4台超微*6028R-E1CR12N服务器用于对象存储(OSS),4台配备74块6TB 容量、采用OpenZFS文件系统的超微*CSE-946ED-R2KJBOD服务器作为对象存储目 标设备(OST)。并通过配置参数调整实现8GiB/s数据吞吐性能,达到了华大基因*的预 期目标。 *其他名称和品牌可能属于其它公司的财产。

Transcript of 利用基于Intel® Enterprise Edition for Lustre* software的高性价比 … ·...

成功案例

利用基于Intel® Enterprise Edition for Lustre* software的高性价比存储解决方案加速挖掘基因信息价值英特尔®至强®处理器E5-2650 v3系列Intel® Enterprise Edition for Lustre* software 生命科学存储

利用基因信息挖掘生命现象的内在规律,不但可以为人类预防疾病提供帮助,更是

人类不断探索生命奥秘的基石。作为全球 最大的基因组学研发机 构,华大基因*,

为应对日均10TB的基因数 据增长和不断提升的数 据读写性能等需求对存储系统

的挑战,部署了基于Intel® Enterprise Edition for Lustre* software,由超微公司*

提供的基于软件定义的开放存储系统,以更低的成本实现了显著的数据吞吐性能提升,加

速挖掘基因测序数据价值的进程,并满足未来不断增长的数据存储需求。

面临挑战

• 提高数据读写性能:现有存储系统提供400MiB/s的数据吞吐能力,已无法满足华大基因*

用于基因信息科学研究的高性能计算集群对数据吞吐性能的需求。

• 降低存储系统成本:面对日均10Tb的基因测序数据增长,华大基因*需要成本更低、存储

密度更大的存储解决方案。

• 增强系统扩展能力:华大基因*急需扩展更灵活的存储系统,面对未来不断复杂的基因研

究对容量和性能的扩展性挑战。

解决方案

• 基于Lustre*的存储方案:华大基因*为其位于武汉的数据中心部署了该解决方案。方

案基于英特尔®至强®处理器E5-2650 v3的超微*服务器,2台超微*6028R-E1CR12N

服务器用于Lustre*元数据存储(MDS),1台配备15块600GB容量硬盘和2块200GB

容量固态盘的超微*CSE-216BE26-R920LPB服务器用于Lustre*对象存储目标

(MDT),4台超微*6028R-E1CR12N服务器用于对象存储(OSS),4台配备74块6TB

容量、采用OpenZFS文件系统的超微*CSE-946ED-R2KJBOD服务器作为对象存储目

标设备(OST)。并通过配置参数调整实现8GiB/s数据吞吐性能,达到了华大基因*的预

期目标。

*其他名称和品牌可能属于其它公司的财产。

部署基于Intel® Enterprise Edition for Lustre*

software的基因测序数据存档存储集群,实现显

著的数据吞吐性能提升,加速基因信息的价值挖

掘和洞察。

“基于Lustre*的存储系统提供出

色的性能和增强的可扩展性,华

大基因*实现了基因信息存档高

达8GiB/s的数据吞吐性能。这一

高性价比的存储解决方案满足了

我们基因信息研究对基因测序数

据读写能力的预期目标,开放的存

储架构使得我们可以用更低的成

本来应对不断增大的存储扩容和

性能扩展需求,Intel® Enterprise

Edition for Lustre* software增强

了Lustre存储系统的稳定性和可

靠性,简化了系统的安装、配置、

监控等工作,降低存储系统的管

理维护成本。”

方林

副院长/信息技术中心主任

深圳华大基因研究院

• Intel® EE for Lustre software:部署

Intel® EE for Lustre* software增强存储

系统的稳定性和可靠性,并简化系统的安

装、配置、监控、管理等工作负担。

影响

• 加速基因信息造福人类:华大基因*实现了

显著的数据吞吐性能提升,可以为基因信

息研究更快的提供数据,满足更复杂的科

研需求,提高研究水平,更充分的利用基因

测序数据。

• 降低基因数据存档成本:基于开放的基础

设施架构,华大基因*降低了存储系统以及

容量扩充成本,同时更高的存储密度降低

了物理空间占用和功耗等成本。

• 降低存储管理维护成本:Intel® Enterprise

Edition for Lustre* software增强了存储

的稳定性和可靠性,同时提供简单而且功

能强大的管理工具,显著降低了存储系统

的管理和维护成本。

• 增强可扩展性:基于Lustre*文件系统的

可扩展能力,华大基因*灵活满足基因信

息数据研究对数据存储容量和性能的调

整需求。

成立于1999年的华大基因*其他名称和品

牌可能属于其它公司的财产。,业已在深

圳、香港、北京、武汉、杭州等地建立了多

个大型生物信息学超级计算中心,总峰值

计算能力达到288.5Tflops,内存容量达到

67.22 TB,存储能力达到35.09 PB。基因

测序通过大规模的计算分析从海量的数据

信息中辨识其载有基因及其序列,并最终

获取遗传信息。不断地利用更新的技术手

段对基因测序结果数据进行研究,对疾病

的预测和预防,精准的诊断治疗,以及药物

的研发都将带来革命性的变化。

数据吞吐性能成为基因研究的掣肘

华大基因*其他名称和品牌可能属于其它公司

的财产。目前用于基因测序数据的存档使用

专有存储系统,数据存入后,需要被多个项

目或实验室读取用于生命科学研究,系统可

提供400MiB/s的数据吞吐性能。华大基因

方林说:“海量、复杂、多变的数据计算需求

一直是横越在基因研究道路上的一道鸿沟,

高性能计算集群的应用和高速发展在基因测

序发展上发挥了重要的作用。然而,受数据

吞吐能力限制,现有数据存储系统的读写性

能已经无法满足相关科研对数据吞吐能力的

需求,由于无法及时的为高性能及群提供数

据,存储系统的性能不但影响研究效率,并

开始成为基因研究技术进一步发展的瓶颈。”

1 性能测试中使用的软件和工作负荷可能仅在英特尔微处理器上进行了性能优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能。上述任何要素的任何变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以辅助您对目标产品进行全面评估。

英特尔、英特尔标识和英特尔至强是英特尔在美国和/或其他国家的商标。

*其他名称和品牌可能属于其它公司的财产。

经验

• Lustre*存储系统为处理科学研究

性数据而研发和优化,为大容量存

储设备提供更优异的性能,是基因

测序数据研究的理想选择。迁移

至基于Lustre*的存储解决方案,

实现20倍的存储性能提升。

• 英特尔®至强®处理器E5-2650 v3

为Lustre*存储系统提供了充足的

运算性能保障,存储对象服务器

(OSS)在96个数据读写进程下,

处理器占用率40%左右,内存占用

率30%左右。1

• 利用Lustre*存储系统灵活的扩

展性满足业务对不断增长的数据

容量和性能的需求,部署Intel®

Enterprise Editionfor Lustre*

software增强Lustre*存储系统的

稳定性和可靠性。

• 部 署 基 于 开放 架 构 平台的 存储

系统,利用不依 赖 硬 件R A ID的

OpenZFS文件系统,以更低的成

本应对不断增长的数据量和数据

吞吐性能挑战。

• 利用磁盘簇(JBOD)提高存储密

度,降低物理空间占用,并通过配

置参数(config)的调整,实现存储

系统数据吞吐性能的优化。

• Intel® Enterprise Edition for

Lustre* software内置了直观而且

功能强大的管理工具,简化Lustre*

存储系统的安装、配置、监控以及

管理等工作,并由英特尔提供强大

完备的技术支持。

急剧增长的数据对存储成本的挑战

此外,伴随业务规模的扩大,华大基因*从

最初的几台基因测序机,已经发展到现在

的数百台,每天产生的新数据量大约10TB

左右。“过去的历史经验表明,基因研究技

术的不断进步,使得用于基因研究的生物

信息数据存储需求每12到18个月就会增长

10倍。”方林接着说:“受昂贵的专用存储

系统限制,华大基因*的数据存储成本和扩

容成本始终居高不下,我们迫切需要对存

储系统实施变革,利用更新的技术手段降

低存储成本。”

对华大基因*而言,寻找一种更高性价比

的存储系统,满足基因研究对性能和成

本的需求,并面向未来的发展,已经迫在

眉睫。

经过性能测试,华大基因*在武汉数据中心

部署了基于Intel® Enterprise Edition for

Lustre software软件的集群存储解决方

案用于基因测序数据的持久存档。

华大基因基因测序存档数据存储架构图

更高性价比的软件定义存储解决方案

Intel® Enterprise Edition for Lustre software

软件、超微*服务器和基于英特尔®至强®处理

器E5-2650 v3系列存储集群相集成,为华

大基因*提供了值得信赖的、高性价比的软

件定义存储(SDS)解决方案。

超微*公司高性能计算部全球副总裁及市场

部总经理Tau Leng说:“作为服务器和存储

创新的领导者,这一基于Lustre*的软件定

义存储解决方案,集成了Intel® Enterprise

Edition for Lustre* software,最大程度

地提升了存储系统的性能、密度、容量和可

靠性,显著降低存储扩容和运营成本。利

用基于开放工业标准的超微*系统,消除对

传统专用存储产品的依赖,凭借4U 90盘

位JBOD等超微*最前沿技术加速业务创

新。超微*提供包含硬件、软件和服务等在

内的整体解决方案,实现快速、高效的部

署和维护一个完整的Lustre*存储系统。”

1 性能测试中使用的软件和工作负荷可能仅在英特尔微处理器上进行了性能优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能。上述任何要素的任何变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以辅助您对目标产品进行全面评估。

英特尔、英特尔标识和英特尔至强是英特尔在美国和/或其他国家的商标。

*其他名称和品牌可能属于其它公司的财产。

Storage Architecture of BGI’s Archived Gene Sequencing Data

Highly cost-effective SDS solution

Intel® EE for Lustre* software, Supermicro servers and storage clusters based on Intel® Xeon™

Processor E5-2650 v3 Family were integrated to deliver for BGI a highly reliable, cost-effective software-

defined storage (SDS) solution.

Dr. Tau Leng, Vice President of HPC and Marketing at Supermicro stated, “As a leader in server and

storage innovation, this integrated software defined solution for Lustre, based on Intel EE for Lustre* has

maximized price/performance, density, capacity and reliability of the storage system, and significantly

reduced the costs of capacity expansion and operation. By eliminating the need for legacy proprietary

storage products with open industry standard Supermicro Systems, the solution accelerates innovation

by enabling the use of leading edge systems such as the 4U 90 Bay JBOD. Our total solution provides the

Unknown: :( ) Verdana, ( )

SimSun, 10 pt,

Michael Mcnerney (Mar , 2016/6/2 18:21

: SDS

Mcmanus, Michael J 2016/6/2 11:06

[10]: Make sure these are 8TB drives. You

can get 8GiB/sec from EACH OSS if you have

5x90-drive JBODs in your design.

Supermicro CSE-946ED-R2KJBODSupermicro CSE-946ED-R2KJBOD

找到适合于您公司的解决方案,请与您的

英特尔代表联系,访问www.intel.com/

lustre或[email protected]

本文件并未(明示或默示、或通过禁止反言或以其他方式)授予任何知识产权许可。

英特尔未做出任何明示和默示的保证,包括但不限于关于适销性、适合特定目的及不侵权的默示保证,及履约过程、交易过程或贸易惯例引起的任何保证。

本文件包含研发中的产品、服务和/或程序信息。这里提供的所有信息可在不通知的情况下随时发生变更。请联系您的英特尔代表,获得最新的预测、计划、规格和路线图。

描述的产品可能包含可能导致产品与公布的技术规格有所偏差的、被称为非重要错误的设计缺陷或错误。一经要求,我们将提供当前描述的非重要错误。

英特尔技术特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务才能激活。没有计算机系统是绝对安全的。更多信息,请见Intel.com,或从原始设备制造商或零售商处获得更多信息。性

能测试中使用的软件和工作负荷可能仅在英特尔微处理器上进行了性能优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能。上述任何要素的变动都有

可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。

本产品中取决于微处理器的优化是针对英特尔微处理器。不具体针对英特尔微架构的特定优化为英特尔微处理器保留。请参考适用的产品用户与参考指南,获取有关本声明中具体指令集的更多信

息。所有性能测试的结果均来自于华大基因的测试报告。想了解更多关于性能和标准的信息,请联系华大基因。

描述的成本降低情景均旨在在特定情况和配置中举例说明特定英特尔产品如何影响未来成本并提供成本节约。情况均不同。英特尔不保证任何成本或成本降低。

英特尔公司2016年版权所有。所有权保留。英特尔、英特尔标识和英特尔至强是英特尔在美国和/或其他国家的商标。

*其他名称和品牌可能属于其它公司的财产。 0616/SHA/PMG/XX/PDF 334526-001CN

显著的数据吞吐性能提升加速基因信

息研究

在英特尔公司的帮助下,华大基因*通过对

Intel®Enterprise Edition for Lustre* software

软件的参数调整进一步优化存储系统,并最

终实现了8GiB/s的数据数据吞吐性能。

华大基因方林说:“和以往相比,存储系统

以更低的存储成本实现了20倍数据读写

能力的提升,可以更快地为科研高性能计

算集群提供数据,充分利用计算资源,基

因研究效率明显提升。更重要的是,Intel®

Enterprise Editionfor Lustre* software

增强了系统的稳定性和可管理性,简化了

系统安装部署、监控和维护等工作。我们

充满信心面对越来越复杂的基因信息研究

对存储系统性能和容量的扩展需求。”

面向未来,华大基因*将继续和英特尔公司

以及超微*公司合作,针对Lustre*存储系

统下的蠕虫及基于目录的磁盘配额等方面

深入探讨,不断推动研究生命奥秘的进程,

利用基因信息造福人类。

Intel® Enterprise Edition for Lustre* software软件配置参数调整

4 x SC847DE26-R2K02JBOD (4 x 72HDDs)Intel® Enterprise Edition for Lustre* software 2.3.0, Config-A:Raidz2 gzip9 ashift=9, Config-B:Raidz3 lz4 ashfit=9

R

10k

8k

5k

2.5k

0k

配置-A最大值 配置-B最大值配置-A平均值 配置-B平均值

MIB

/s 吞吐

W RW

*其他名称和品牌可能属于其它公司的财产。