Benchmark during different architecture cloud IBM z Systems vs Intel Xeon
-
Upload
hirofumi-nakata -
Category
Internet
-
view
385 -
download
3
Transcript of Benchmark during different architecture cloud IBM z Systems vs Intel Xeon
![Page 1: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/1.jpg)
Benchmark during different architecture cloud
IBM z Systems vs Intel Xeon
2016/5/1Hirofumi Nakata
Copyright 2016 Hirofumi Nakata 1
![Page 2: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/2.jpg)
Copyright 2016 Hirofumi Nakata 2
1 はじめに昨今、メインフレームモダナイゼーションとして、旧来の COBOL 資産を java などへ置き換えると同時に、稼働プラットフォームをオープン系システムにダウンサイジングを行う事例が多い。全日空などでの大規模トランザクションシステムをメインフレームからオープン系に移行し、 java で開発した上で稼働した場合に、オープンアーキテクチャの限界と思われる問題がまだ存在するのは事実である。滞留した大量トランザクションを捌ききれずにシステムダウンしてしまった。IBM メインフレームにおいては、 Linux の稼働や java のネイティブ稼働が可能であり、言語環境を java に近代化した上で、メインフレームアーキテクチャの優位性も享受したシステムの構築が可能である。メインフレームは従来より多重実行性能が優れているが、 java/C アプリケーション実行パフォーマンスにおいて、オープン系システムにアドバンテージがあった。メインフレームを用いた、 java 大規模トランザクションシステムが構築が可能なのかをベンチマークで比較して考察する。クラウドコンピューティングで最も使われているアーキテクチャは Intel アーキテクチャである。Intel アーキテクチャクラウド環境として、 Amazon Web Service を利用する。 IBM z Systems環境として、 LinuxOne Cloud (US Marist カレッジに設置 ) を用いて比較する。
![Page 3: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/3.jpg)
Copyright 2016 Hirofumi Nakata 3Copyright 2016 Hirofumi Nakata 3
2 比較に用いたクラウド環境
Amazon Web ServicesInstance :c4.large Memory:3.85GB vCPU:2 ECU:8Intel(R) Xeon(R) CPU E5-2666 v3 @ 2.90GHz (5786.7 bogomips)Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
LinuxOne CloudInstance : Memory:4GB vCPU:2 CPU:vendor_id : IBM/S390# processors : 2bogomips per cpu: 20325.005GHz
On-premisesInstance: Memory:4GB vCPU:2 Vmware-workstationIntel(R) Xeon(R) CPU X5650 @ 2.67GHz (5320.0 bogomips)x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
![Page 4: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/4.jpg)
Copyright 2016 Hirofumi Nakata 4Copyright 2016 Hirofumi Nakata 4Copyright 2016 Hirofumi Nakata 4
3 ベンチマーク内容
1 UnixBench 総合的なベンチマーク測定。 https://github.com/kdlucas/byte-unixbench
2 FFT と AGM による円周率計算プログラム 8,388.608 桁計算実行 ELAPS を測定。演算性能測定。http://www.kurims.kyoto-u.ac.jp/~ooura/pi_fft-j.html
3 システム多重性能測定 大量コンテキストスイッチ発生時における、 ELAPS 測定。 大量コンテキストスイッチ発生時における、円周率計算プログラム ELAPS 測定 ベンチマークプログラムを C 言語で作成 384 回 fork() を行う、ラッパープログラム。以下 (fileread.c) を execcl (context.c) 262,144byte ファイルを 1byte ずつ Read する。 1byte ごとに 10us sleep (fileread.c)
![Page 5: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/5.jpg)
Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5Copyright 2016 Hirofumi Nakata 5
ベンチマーク結果 比較
![Page 6: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/6.jpg)
Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6Copyright 2016 Hirofumi Nakata 6
処理演算性能比較
ベンチマーク結果 比較1 整数演算性能比較 UnixBench Dhrystone 2 using register variables
2 浮動小数点演算性能比較 UnixBench Double-Precision Whetstone
3 浮動小数点演算性能比較 FFT と AGM による円周率計算プログラム 8,388,608 桁計算実行
![Page 7: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/7.jpg)
Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7Copyright 2016 Hirofumi Nakata 7
ベンチマーク結果 比較
1 整数演算性能比較 UnixBench Dhrystone 2 using register variables
1
0 5000000 10000000 15000000 20000000 25000000 30000000 35000000 40000000 45000000
28756834.1
40423150.3
37747222.2
UnixBench
aws.c4.large s390x ia_64
Dhrystone 2 using register variables (lps)
![Page 8: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/8.jpg)
Copyright 2016 Hirofumi Nakata 8
2 浮動小数点演算性能比較 UnixBench Double-Precision Whetstone
1
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
3660.5
2937.5
4586.9
UnixBench
aws.c4.large s390x ia_64
Double-Precision Whetstone (MWIPS)
![Page 9: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/9.jpg)
Copyright 2016 Hirofumi Nakata 9
3 浮動小数点演算性能比較 FFT と AGM による円周率計算プログラム
1
0 50 100 150 200 250 300
93
88
71
Context Switch Bench
aws.c4.large s390x ia_64
pi 8388608 digits (sec)
![Page 10: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/10.jpg)
Copyright 2016 Hirofumi Nakata 10
多重処理性能比較
1 コンテキストスイッチ性能比較 UnixBench Pipe-based Context Switching
2 コンテキストスイッチ性能比較 fileread 384 process MAX Context switch
3 多重処理性能比較 fileread 384 process AVG.Elaps
4 多重処理性能比較 pi 8388608 digits with fileread 384 process
![Page 11: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/11.jpg)
Copyright 2016 Hirofumi Nakata 11
1 コンテキストスイッチ性能比較 UnixBench Pipe-based Context Switching
1
0 100000 200000 300000 400000 500000 600000
216318.4
504884
473149
UnixBench
aws.c4.large s390x ia_64
Pipe-based Context Switching (cswitch/sec)
![Page 12: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/12.jpg)
Copyright 2016 Hirofumi Nakata 12
2 コンテキストスイッチ性能比較 fileread 384 process MAX Context switch
1
0 200000 400000 600000 800000 1000000 1200000 1400000 1600000
580085
1333624
656553
Context Switch Bench
aws.c4.large s390x ia_64
fileread 384 process MAX Context switch
![Page 13: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/13.jpg)
Copyright 2016 Hirofumi Nakata 13
3 多重処理性能比較 fileread 384 process elaps Avg.
1
0 50 100 150 200 250 300
170.548739
76.123154
152.38854
Context Switch Bench
aws.c4.large s390x ia_64
fileread 384 process AVG.Elaps (sec)
![Page 14: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/14.jpg)
Copyright 2016 Hirofumi Nakata 14
4 多重処理性能比較 pi 8388608 digits with fileread 384 process
1
0 50 100 150 200 250 300
245
144
223.93
Context Switch Bench
aws.c4.large s390x ia_64
pi 8388608 digits with fileread 384 process (sec)
![Page 15: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/15.jpg)
Copyright 2016 Hirofumi Nakata 15
考察
![Page 16: Benchmark during different architecture cloud IBM z Systems vs Intel Xeon](https://reader036.fdocuments.net/reader036/viewer/2022082907/58a095021a28aba73f8b6f4f/html5/thumbnails/16.jpg)
Copyright 2016 Hirofumi Nakata 16Copyright 2016 Hirofumi Nakata 16
考察 異アークテクチャー間での比較であるが、測定結果から AWS c4.large と LinuxOne cloud との処理性能はほぼ同等と推測される。まずは処理性能においては浮動小数点演算項目 (Double-Precision Whetstone) において aws c4.large 及び On-premises 環境に対して、劣る結果となっているが、浮動小数点演算項目 (FFT と AGM による円周率計算プログラム 8,388,608 桁計算実行 ) においてはほぼ同等の性能である。このことから、 IBM メインフレーム z Systems z13 において、浮動小数点演算処理性能は AWS c4.largeレベルで担保できると考察する。多重処理性能においては、コンテキストスイッチ性能は AWS c4.large に比べ、倍以上の性能を持つ。このことが大量トランザクション処理を安定して実行できることを確認した。AWS c4.large でコンテキストスイッチ数が頭打ちとなってしまうと、他のプロセス処理が全て停止してしまう現象を確認した。 LinuxOne においてはそのような現象は確認されなかった。以上の結果からメインフレームのメリットを生かしつつ、パフォーマンスも担保できるシステムを構築することが可能であると考察する。