Benchmark during different architecture cloud IBM z Systems vs Intel Xeon

Benchmark during different architecture cloud

IBM z Systems vs Intel Xeon

2016/5/1Hirofumi Nakata

Copyright 2016 Hirofumi Nakata 1


1 はじめに昨今、メインフレームモダナイゼーションとして、旧来の COBOL 資産を java などへ置き換えると同時に、稼働プラットフォームをオープン系システムにダウンサイジングを行う事例が多い。全日空などでの大規模トランザクションシステムをメインフレームからオープン系に移行し、 java で開発した上で稼働した場合に、オープンアーキテクチャの限界と思われる問題がまだ存在するのは事実である。滞留した大量トランザクションを捌ききれずにシステムダウンしてしまった。IBM メインフレームにおいては、 Linux の稼働や java のネイティブ稼働が可能であり、言語環境を java に近代化した上で、メインフレームアーキテクチャの優位性も享受したシステムの構築が可能である。メインフレームは従来より多重実行性能が優れているが、 java/C アプリケーション実行パフォーマンスにおいて、オープン系システムにアドバンテージがあった。メインフレームを用いた、 java 大規模トランザクションシステムが構築が可能なのかをベンチマークで比較して考察する。クラウドコンピューティングで最も使われているアーキテクチャは Intel アーキテクチャである。Intel アーキテクチャクラウド環境として、 Amazon Web Service を利用する。 IBM z Systems環境として、 LinuxOne Cloud (US Marist カレッジに設置 ) を用いて比較する。

Copyright 2016 Hirofumi Nakata 3Copyright 2016 　 Hirofumi Nakata 3

2 比較に用いたクラウド環境

Amazon Web ServicesInstance :c4.large Memory:3.85GB vCPU:2 ECU:8Intel(R) Xeon(R) CPU E5-2666 v3 @ 2.90GHz (5786.7 bogomips)Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET

LinuxOne CloudInstance : Memory:4GB vCPU:2 CPU:vendor_id : IBM/S390# processors : 2bogomips per cpu: 20325.005GHz

On-premisesInstance: Memory:4GB vCPU:2 Vmware-workstationIntel(R) Xeon(R) CPU X5650 @ 2.67GHz (5320.0 bogomips)x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET

Copyright 2016 Hirofumi Nakata 4Copyright 2016 　 Hirofumi Nakata 4Copyright 2016 　 Hirofumi Nakata 4

3 ベンチマーク内容

1 UnixBench 総合的なベンチマーク測定。 https://github.com/kdlucas/byte-unixbench

2 FFT と AGM による円周率計算プログラム 8,388.608 桁計算実行 ELAPS を測定。演算性能測定。http://www.kurims.kyoto-u.ac.jp/~ooura/pi_fft-j.html

3 システム多重性能測定　大量コンテキストスイッチ発生時における、 ELAPS 測定。　大量コンテキストスイッチ発生時における、円周率計算プログラム ELAPS 測定ベンチマークプログラムを C 言語で作成　　　 384 回 fork() を行う、ラッパープログラム。以下 (fileread.c) を execcl 　 (context.c) 262,144byte ファイルを 1byte ずつ Read する。 1byte ごとに 10us sleep (fileread.c)

Copyright 2016 Hirofumi Nakata 5Copyright 2016 　 Hirofumi Nakata 5Copyright 2016 　 Hirofumi Nakata 5Copyright 2016 　 Hirofumi Nakata 5

　

ベンチマーク結果　比較

Copyright 2016 Hirofumi Nakata 6Copyright 2016 　 Hirofumi Nakata 6Copyright 2016 　 Hirofumi Nakata 6Copyright 2016 　 Hirofumi Nakata 6Copyright 2016 　 Hirofumi Nakata 6

処理演算性能比較

ベンチマーク結果　比較1 整数演算性能比較　 UnixBench Dhrystone 2 using register variables

2 浮動小数点演算性能比較　 UnixBench Double-Precision Whetstone

3 浮動小数点演算性能比較　 FFT と AGM による円周率計算プログラム 8,388,608 桁計算実行　

Copyright 2016 Hirofumi Nakata 7Copyright 2016 　 Hirofumi Nakata 7Copyright 2016 　 Hirofumi Nakata 7Copyright 2016 　 Hirofumi Nakata 7Copyright 2016 　 Hirofumi Nakata 7Copyright 2016 　 Hirofumi Nakata 7

ベンチマーク結果　比較

1 整数演算性能比較 UnixBench Dhrystone 2 using register variables

1

0 5000000 10000000 15000000 20000000 25000000 30000000 35000000 40000000 45000000

28756834.1

40423150.3

37747222.2

UnixBench

aws.c4.large s390x ia_64

Dhrystone 2 using register variables (lps)


2 浮動小数点演算性能比較 UnixBench Double-Precision Whetstone

1

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

3660.5

2937.5

4586.9

UnixBench


Double-Precision Whetstone (MWIPS)


3 浮動小数点演算性能比較 FFT と AGM による円周率計算プログラム

1

0 50 100 150 200 250 300

93

88

71

Context Switch Bench


pi 8388608 digits (sec)


多重処理性能比較

1 コンテキストスイッチ性能比較　 UnixBench 　 Pipe-based Context Switching

2 コンテキストスイッチ性能比較　 fileread 384 process MAX Context switch

3 多重処理性能比較　 fileread 384 process AVG.Elaps

4 多重処理性能比較　 pi 8388608 digits with fileread 384 process　


1 コンテキストスイッチ性能比較　 UnixBench 　 Pipe-based Context Switching　

1

0 100000 200000 300000 400000 500000 600000

216318.4

504884

473149

UnixBench


Pipe-based Context Switching (cswitch/sec)


2 コンテキストスイッチ性能比較　 fileread 384 process MAX Context switch

　

1

0 200000 400000 600000 800000 1000000 1200000 1400000 1600000

580085

1333624

656553



fileread 384 process MAX Context switch


3 多重処理性能比較 fileread 384 process elaps Avg.

1

0 50 100 150 200 250 300

170.548739

76.123154

152.38854



fileread 384 process AVG.Elaps (sec)


4 多重処理性能比較 pi 8388608 digits with fileread 384 process

1

0 50 100 150 200 250 300

245

144

223.93



pi 8388608 digits with fileread 384 process (sec)


考察

Copyright 2016 Hirofumi Nakata 16Copyright 2016 　 Hirofumi Nakata 16

考察　異アークテクチャー間での比較であるが、測定結果から AWS c4.large と LinuxOne cloud との処理性能はほぼ同等と推測される。まずは処理性能においては浮動小数点演算項目 (Double-Precision Whetstone) において aws c4.large 及び On-premises 環境に対して、劣る結果となっているが、浮動小数点演算項目 (FFT と AGM による円周率計算プログラム 8,388,608 桁計算実行 ) においてはほぼ同等の性能である。このことから、 IBM メインフレーム z Systems z13 において、浮動小数点演算処理性能は AWS c4.largeレベルで担保できると考察する。多重処理性能においては、コンテキストスイッチ性能は AWS c4.large に比べ、倍以上の性能を持つ。このことが大量トランザクション処理を安定して実行できることを確認した。AWS c4.large でコンテキストスイッチ数が頭打ちとなってしまうと、他のプロセス処理が全て停止してしまう現象を確認した。 LinuxOne においてはそのような現象は確認されなかった。以上の結果からメインフレームのメリットを生かしつつ、パフォーマンスも担保できるシステムを構築することが可能であると考察する。

Benchmark during different architecture cloud IBM z Systems vs Intel Xeon

Internet

Transcript of Benchmark during different architecture cloud IBM z Systems vs Intel Xeon