第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM...

58
© 2012 IBM Corporation IBMクラウド”CoDサービス実運用の現場より IBM Systems Softwareを活用した 運用自動化のご紹介 しすなま!第20回 日本アイ・ビー・エム株式会社 STG. PureSystems Solution 佐々木 敦守 日本アイ・ビー・エム株式会社 STG. Linux/OSS & Cloud Support Center 阿部純一郎 Revision 1.0

description

下記のしすなま!録画と併せてご覧ください。資料・録画の内容は生放送時点のものです。 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20) 佐々木 敦守 日本アイ・ビー・エム(株) STG. Technical Sales. ATC. PureSystems Solution, Advisory IT Specialist, IBM Computing on Demand 阿部 純一郎 日本アイ・ビー・エム(株) STG. Technical Sales. ATC. Linux/OSS & Cloud Support Center, Client Technical Architect - Systems Software http://www.ustream.tv/recorded/25544654

Transcript of 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM...

Page 1: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation

IBMクラウド”CoDサービス”実運用の現場より

IBM Systems Softwareを活用した運用自動化のご紹介

しすなま!第20回

日本アイ・ビー・エム株式会社 STG. PureSystems Solution 佐々木 敦守日本アイ・ビー・エム株式会社 STG. Linux/OSS & Cloud Support Center 阿部純一郎

Revision 1.0

Page 2: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation2

しすなま!第20回

はじめに

この資料の内容に関しては正式なIBM のテストを受けておりません。この資料は、資料

作成時における 新情報をご参考のために提供することを目的として記載されており、IBMは、情報の正確性、完全性または有用性について何ら保証するものではありませ

ん。また、内容は予告なしに変更または更新されることがあります。

この資料の内容は、限られた検証環境における結果に基づくものであり、全ての環境で同一の結果を保証するものではありません。お客様固有の環境に対し、適切であるかどうか、また、正確であるかどうかは十分検証されていません。この資料の情報に基づき導入・設定を実施される場合には、十分な検証テストを行ってください。また、予め製品のマニュアルおよびディストリビューターが提供する情報をご覧ください。

この資料の情報に基づいて導入・設定・運用した結果について、IBMはいかなる保証も

責任も負いかねますので予めご了承ください。

Page 3: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation3

しすなま!第20回

特記事項および商標

本文書の内容は、特に記載の無い限り、2012年9月20日現在に公開されている文書に基づいています。

本文書において、IBM 製品、プログラム、およびサービスについて言及する場合がありますが、このことはこのような IBM 製品、プログラ ム、およびサービスが IBM が企業活動を行っているすべての国で使用できることを意味するものではありません。本文書で、IBM 製品、プログラム又はサービスに言及する部分があっても、このことは当該製品、プログラム、またはサービスのみが使用可能であることを意味するものではありません。これらのIBM製品、プログラム、またはサービスに代えて、IBM の知的所有権を侵害することのない機能的に同等のプログラムを使用することができます。

本文書に記載されている情報の使用または手法の実施は、お客様の評価および使用している動作環境への統合能力にしたがって、お客様の責任で行っていただきます。記載されている情報はいずれもIBMにより、特定の状況における正確さは確認されているはずですが、いかなる環境においてもそれと同じ、あるいは同様な結果が得られるとは限りません。お客様独自の環境において、これらの手法を適用する場合は、お客様の責任で行っていただきます。

商標– IBM はInternational Business Machines Corporation の登録商標– IBM System は International Business Machines Corporation の商標– System z は International Business Machines Corporation の商標– System x は International Business Machines Corporation の商標– Power Systems は International Business Machines Corporation の商標– BladeCenter は International Business Machines Corporation の商標– iDataPlexは International Business Machines Corporation の商標– IBM Systems Director Active Energy Managerは International Business Machines Corporation の登録商標– Systems Director VMControl は International Business Machines Corporation の商標– AIX は International Business Machines Corporation の登録商標– AIX 6 はInternational Business Machines Corporation の商標– AIX 7 はInternational Business Machines Corporation の商標– POWER6 は International Business Machines Corporation の商標– POWER7 は International Business Machines Corporation の商標– IBM i5/OS は International Business Machines Corporation の商標– EnergyScale は International Business Machines Corporation の商標– VMware vCenter Serverは、VMware Incorporationの商標– Windowsは、Microsoft Corporationの米国およびその他の国における登録商標– Intel, Pentium は Intel Corporation の米国およびその他の国における登録商標– Linux は、Linus Torvalds の米国およびその他の国における登録商標– その他、本文書で使用するシステム名、製品名、会社・団体の名称はそれぞれ各社の商標または登録商標です

Page 4: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation4

しすなま!第20回

更新履歴

– 2012年 9月 20日 初版 (Rev. 1.0) 発行

Page 5: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation5

しすなま!第20回

本日の内容

1. IBMクラウド・オファリングCoDのご紹介

2. IBM Systems Softwareによるクラウド・デリバリーの自動化– 初期セットアップ編– プロビジョニング編– モニタリング編

3. PureSystemsによるクラウド・デリバリーの変化

System xのさらなる運用効率化のヒントに。

運用観点でのSystem xの優位性を再確認。

Page 6: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation6

しすなま!第20回

第1章

IBMクラウド・オファリングCoDのご紹介

Page 7: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation7

しすなま!第20回

(ご参考)http://www.ibm.com/ibm/jp/cloud/solutions/

IBM SmarterCloud ポートフォリオ (2012年9月現在)

Page 8: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation8

しすなま!第20回

IBM Computing on Demand (CoD) とは

IBM CoDセンターお客様お客様

(ご参考)http://www.ibm.com/systems/jp/deepcomputing/DCCoD/

専用線専用線 / VPN

/ VPN

IBM Computing on Demand (CoD) はIBMのIaaS型クラウド・オファリングです。

新のIBMサーバー

高速ネットワーク

物理サーバー専有型

HighPerformance

Secure

On Demand

High PerformanceHigh Performance

On DemandOn Demand

SecureSecure

すぐに利用可能

従量課金

高拡張性

国内IBMデータセンター

専用線/VPNによるアクセス

VLANセキュリティ

Page 9: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation9

しすなま!第20回

CoDサービス適用業界

業界業界 アプリケーションの例アプリケーションの例

金融 リスク分析ポートフォリオおよび財産管理デリバティブ・シミュレーション

デジタル・メディア CGレンダリング

学術 数値解析

建築 構造解析流体計算

製造 CAD (Computer Aided Design)CAE (Computer Aided Engineering)EDA (Electronic Design Automation)

放送 コンテンツ管理システム

その他 開発・テストベンチマーク

CoD は大規模な計算リソースを必要とするHigh Performance Computing (HPC)分野のお客様を中心にご利用いただいております。

(ご参考)http://www.ibm.com/systems/jp/deepcomputing/DCCoD/solution.html

Page 10: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation10

しすなま!第20回

第1章:まとめクイズ

Q1.CoDは、IBM SmarterCloud ポートフォリオにおける

マネージド・クラウド・サービス の1つである。

Q2. CoDは、物理サーバー 専有型のサービスである。

Q3. CoDは、主に HPC 分野のお客様に広く利用されている。

??

??

??

Page 11: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation11

しすなま!第20回

第2章

IBM Systems Softwareによる

クラウド・デリバリーの自動化

Page 12: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation12

しすなま!第20回

CoDサービスのデリバリー・プロセス概要

初期初期セットアップセットアップ

プロビジョニングプロビジョニング モニタリングモニタリング

•電源制御

•Firmware更新

•uEFI/BIOS設定

•OS導入/構成

•SW導入/構成

•インフラ監視

•障害対応

初期初期セットアップセットアップ

プロプロビジョニングビジョニング

モニモニタリングタリング

初期初期セットアップセットアップ

プロプロビジョニングビジョニング

モニモニタリングタリング

金融シミュレーションの計算基盤としてBladeCenterを3年間使いたい。

構造解析システムの基盤としてiDataPlexを半年間使いたい。

CGレンダリング用に 新のGPGPUマシンを3ヶ月使いたい。

A証券様

B建設様

Cアニメーション様

Page 13: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation13

しすなま!第20回

CoDサービス・デリバリーにおける課題の整理

大規模分散環境– 数百台から数千台のサーバーで構成される。– x86サーバーが主である。

– 複数のデータセンターに点在する。

ヘテロジニアス– お客様毎に利用機種が異なる– お客様毎、導入時期毎に利用OS種類やそのバージョン

が異なる。– スイッチ、ストレージも管理対象。

マルチテナンシー– 複数のお客様が入れ替わり立ち替わり利用するためシ

ステム変更頻度が高い。– システム変更のサイクルが比較的短い。– 同時に複数のお客様にサービスを提供する。

効率的に管理したい

統合的に管理したい

正確に管理したい

Page 14: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation14

しすなま!第20回

初期セットアップ電源制御

uEFI/BIOS, IMM設定

システム情報の収集

FW更新

プロビジョニングOSのインストール

ソフトウェアのインストール

OS・ソフトウェアの設定

モニタリングサーバー

ネットワーク

ストレージ

IBM Computing on DemandIBM Computing on Demand

CoDサービスを支えるIBM Systems Software

IBM ToolsCenter- Advanced Setting Utility- Bootable Media Creator

IBM Systems DirectorSNEM

CoDサービス・デリバリーでは各フェーズでSystems Directorを中心とするIBM Systems Softwareをフル活用しております。

Page 15: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation15

しすなま!第20回

初期セットアップ編

Page 16: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation16

しすなま!第20回

データセンターに大量のサーバーが搬入された・・・

1人でいい?

来週までにお願い。

何台あるんだろう・・・

uEFI/IMMの設定変更箇所が多いな・・・

電源制御が大変そう・・・

ファームウェアを全て 新にしなきゃ・・・

了解です・・・

リーダー

デリバリー担当

構成管理表もいるな・・・

データセンターは寒そう・・・

パラメーター・シートどおりにやってね。

Page 17: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation17

しすなま!第20回

例)CoDサービスでの電源制御

IPMI Management Utilitiesを使えば、管理対象サーバーの電源制御を自動化できます。– System x製品のシステム管理プロセッサーであるIMM2は、業界標準管理インターフェース

IPMI (Intelligent Platform Management Interface) Version 2.0をサポートしています。– IPMIutilは、IPMIを管理および構成するのに使用できるさまざまなツールを提供します。

– インバンド/アウト・オブ・バンドを使用して、リモートから操作することができます

※IPMI Management Utilitiesの詳細について、あるいはIPMIutilをダウンロードするには、

http://ipmiutil.sourceforge.net/ にアクセスしてください。

IMM管理用LAN

ipmiutil reset -N <IMM_IP> -U <IMM_USER> -P <IMM_PASSWORD> -uipmiutil reset -N <IMM_IP> -U <IMM_USER> -P <IMM_PASSWORD> -dipmiutil reset -N <IMM_IP> -U <IMM_USER> -P <IMM_PASSWORD> -c

ON OFF Restart

リモート電源制御

電源ボタンは押さなくて

よい♪

IPMIutil

IMM

Page 18: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation18

しすなま!第20回

例)CoDサービスでのuEFI/IMM設定

リモートuEFI/IMM管理

▼設定変更asu set uEFI.OperatingMode "Performance Mode" --host <IMM_IP> --user <IMM_USER> --password <IMM_PASSWORD>

▼設定参照asu show all --host <IMM_IP> --user <IMM_USER> --password <IMM_PASSWORD> > <IMM_IP>_showall_log.txt

IBM Advanced Settings Utility (ASU)を使えば、管理対象サーバーのuEFI/IMMの設定

変更を自動化できます。– ASUは、uEFI/IMMなどの設定が可能なコマンドラインツールです。– ASUはIBMが提供するフリーツールです。– 設定内容はファイル形式で保存/リストアすることができます。

※ASUの詳細について、あるいはASUをダウンロードするには、http://www.ibm.com/support/entry/portal/docdisplay?lndocid=TOOL-ASU/ にアクセスして

ください。

IMM管理用LANF1起動は

不要♪

設定情報収集も簡単♪

show set save

ASU

Page 19: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation19

しすなま!第20回

例)CoDサービスでのファームウェア更新

Diag NIC

BIOS

ServeRAID

HDD

Bootabe Image

PXE files

IBM ToolsCenter Bootable Media Creator (BoMC)とPXEサーバーを使えば簡単に

ファームウェア更新ができます。– BoMCは、簡単なGUI操作でファームウェアを一括更新するメディアを作成するSystem xおよ

びBladeCenterのツールです。– さらにPXEサーバー を使えば、BoMCで作成したメディアを、ネットワーク経由でターゲットマシ

ンに配布することができます。

※BoMCの詳細について、 あるいはBoMCをダウンロードするには、http://www.ibm.com/support/entry/portal/docdisplay?lndocid=TOOL-BOMC、およびhttp://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-00B98A0 にア

クセスしてください。更新結果のログ回収も簡単♪

PXE

IMM管理用LAN

Log

ファームウェア一括更新

Page 20: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation20

しすなま!第20回

もっと詳しく知りたい方のために・・・

IBM システム管理 - IBM ToolsCenterのご紹介 - Japan– IBM System x/BladeCenterの導入やメンテナンスを支援するIBM ToolsCenterによる初期導

入、設定、更新、問題判別など、サーバー運用管理の方法が解説されています。• http://www.ibm.com/systems/jp/x/sysmanage/toolscenter.shtml

IBM ToolsCenter 機能説明資料– IBM ToolsCenterの各ツールについて、その概要および機能について記載されています。

• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-027181B

Integrated Management Module II (IMM2) 関連 FAQ– 本FAQでは特に、IBM System xおよびIBM BladeCenterにおけるIMM2に関連したQ&Aをま

とめています。• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-037ABAB

Integrated Management Module II (IMM2) 操作ガイド– 本資料はIMM 2(Integrated Management Module 2)の操作について記載されたガイドです。

• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-03F54F2

Page 21: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation21

しすなま!第20回

プロビジョニング編

Page 22: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation22

しすなま!第20回

大量の物理サーバーにOSをインストールしたい・・・

OS導入・設定もよろしく

ソフトウェアもね。

サーバー毎に利用OSが違う

OSのネットワーク設定大変そう・・・

ソフトウェアも・・・

了解です・・・

パラメーター・シートどおりにやってね。

リーダー

サーバー配置とIPアドレスの順番を合わせて管理したい。

数百台はある・・・

デリバリー担当

来週までにお願い。

Page 23: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation23

しすなま!第20回

IBM Systems Director Editions for x86 の製品ラインアップ

Storage Control 4.2.1.1 は Systems Director Editions に含まれませんVMControl Enterprise Edition for x86 は Systems Director Editions に含まれません(VMControl Express Edition のみ含まれます)

金額など詳細な情報はこちらをご参照ください– IBM Systems Director Editions v6.3 製品構成とライセンス価格のガイド– https://www.gosavo.com/Document/Document.aspx?id=2417586

○Upward Integration for Microsoft System Center 3.1

○(有無選択可)Virtual Media Key

1年または3年間の

ソフトウェアサポート

Express Edition

1年または3年間の

ソフトウェアサポート保守サポート(サブスクリプション&サポート)

Systems Director

大消費電力値設定

消費電力・温度測定

○Upward Integration for VMware vSphere 1.1○Tivoli Provisioning Manage for OS Deployment 7.1.1○Network Control 1.3○Service and Support Manager 6.3○VMControl Express Edition 2.4○

○Active Energy Manager 4.4

○Systems Director 6.3

Standard EditionSystems Director 構成要素

Page 24: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation24

しすなま!第20回

Tivoli Provisioning Manager for OS Deployment

GUI操作で簡単♪

TPMfOSDを使えば効率的にOSプロビジョニングができます。– 簡単なWeb ベースのコンソールにより簡単にどこからでも操作可能。– 様々なハードウェア機種をサポート(Systems x、iDataPlex, BladeCenter,

System p)– 様々なOSプロビジョニングをサポート(Windows、Linux、VMware ESX)

– ソフトウェアも同時にプロビジョニング可能(ソフトウェア・パッケージ機能)– マルチキャストでスピーディーにプロビジョニング。– 既存の参照マシンからOSイメージをキャプチャーすることも可能。

TPM

TPMサーバー管理対象マシン

OSイメージLinuxLinux

WindowsWindows

VMwareVMwareリモート・

プロビジョニング

Page 25: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation25

しすなま!第20回

例)CoDサービスでのOSイメージ管理

Windows 2003

Windows 2008

Software B

Software A

Linux

Config 2

Config 1

×

Linux

Software AConfig 1

Windows 2003

Windows 2008

Software AConfig 2

Config 2Software B

Software A

OSプレーン

イメージ

お客様A

お客様B

お客様C

TPMfOSDはお客様要件に応じて、必要なOSイメージにOS設定やソフトウェアのパッケージを組み合わせることで、複数のパターンのOSイメージを効率的に生成できます。– OS標準インストール・イメージをプレーンイメージとして保管– お客様要件に応じたOS構成ファイル・スクリプトをパッケージとして作成

– お客様要件に応じたソフトウェア・メディアをパッケージとして作成

ソフトウェアパッケージ

OS構成スクリプト

マスターイメージ

効率的にOSイメージ

を作成♪

ソフトウェアイメージ

Page 26: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation26

しすなま!第20回

26

例)CoDサービスでのサーバー配置管理

Linuxの場合– host 宣言文の中の hardware ethernet パラ

メータと fixed-address パラメータを使用することで、ネットワークカードの MAC アドレスに IP アドレスを割り当てます。これにより、ラック内のサーバの物理位置とIPアドレスをマッピングでき

管理効率が向上します。

Windowsの場合– Linuxの場合(前頁)と同様の設定が、[スター

ト] [管理] [DHCP]により設定できます。

– 例) netshコマンドを使用して、スコープ”172.16.0.0”内でMACアドレスとIPアドレス172.16.0.101の紐づけを実施

数百台規模のクラスタにOSプロビジョニングを実施する場合、構成管理効率化のため、ラック内の物理的な位置とDHCPから割り振られるIPアドレスの紐付けを実施し順番を揃えることを推奨します。

> netsh DHCP server scope 172.16.0.0 add reservedip 172.16.0.101 MACアドレス iData01 “” both

スクリプトで一括設定すればいいね♪

Page 27: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation27

しすなま!第20回

もっと詳しく知りたい方のために・・・

製品・サービス発表レター– IBM Tivoli Provisioning Manager for OS Deployment V7.1.1の発表の機能一覧

を確認できます。• http://www.ibm.com/jp/domino02/NewAIS/aisextr.nsf/ByLetterNo/TIV09048?OpenDo

cument

Tivoli Provisioning Manager for OS Deployment 7.1.1 導入・操作ガイド– 導入・設定方法や、Windows/Linux/VMware ESXのOSの配布手順をステップ バイ

ステップで紹介しています。• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-022C912

TPM 7.2による クラスター構築と実践テクニック– OSおよびソフトウェアのプロビジョニングを Tivoli Provisioning Manager V7.2 を使

用した IBM社内での運用経験をまとめた資料です。• http://www.ibm.com/software/jp/tivoli/tech/00512d7b.html

Page 28: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation28

しすなま!第20回

モニタリング編

Page 29: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation29

しすなま!第20回

大規模なハードウェア基盤をどう監視するか?

サーバー、NW、ストレージ

の監視もよろしく。

サーバー・モデルは様々・・・

障害をどう通知しよう・・・

NWスイッチも・・・

SAN環境も・・・

了解です・・・ リーダー

監視対象が複数データセンターに点在する・・・

デリバリー担当

人的リソースは限られている。

通知漏れがないように。

要員はこれ以上増やせない。

Page 30: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation30

しすなま!第20回

ヘテロジニアスヘテロジニアス

CoDハードウェア基盤の特徴と監視要件の整理

• サーバー:System x、BladeCenteriDataPlex、System p

• スイッチ: Cisco、BNT• ストレージ: DS、XIV

統合的な監視統合的な監視• 多種多様な機器からの

各々のイベントを集約できる

• システム全体の状況を一覧できる

継続性ある監視継続性ある監視

• サービスに影響なく監視設定変更ができる

• 可用性のある監視サービスを提供できる。

迅速な通知迅速な通知

• 障害発生時にリアルタイムに確認できる。

• どのお客様のどの環境で障害があったかをすぐに識別できる。

マルチテナンシーマルチテナンシー

• 複数のお客様へのサービス提供

• 異なる利用期間

大規模分散環境大規模分散環境

• サーバー: 数百台~• ストレージ: 数十台~• 設置場所: 数箇所~

Page 31: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation31

しすなま!第20回

IBM Systems Director で様々な IT プラットフォームの統合管理が実現できます

IBM Systems Directorサーバー

監視対象ストレージ装置 / FC スイッチ

SMI-S プロバイダー

API

ストレージ機器の管理Storage Control

ネットワーク機器の管理Network Control

SNMP

監視対象ネットワークスイッチ

IBM BLADE Harmony Manager

ハイパーバイザーや仮想サーバーの管理VMControl

Hyper-V VMware ESX KVM

監視対象仮想ネットワークスイッチ

API

API

サーバーの管理Systems Director

System z, Power SystemsSystem x, BladeCenter

IBM Systems Director ではさまざまな IT プラットフォームの

統合管理を行うことを目指しています

IBM Systems Director ではさまざまな IT プラットフォームの

統合管理を行うことを目指しています

SMI-S

PowerVM z/VM

Page 32: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation32

しすなま!第20回

CoDサービスでのSystems Director監視全体像

死活監視

ツール

IBM CoD センター

お客様A

管理NW

管理NW

管理NW

運用担当

IMM

AMM

IMM

ネットワーク

お客様B

お客様C

死活監視ツールでPing監視を実施。geneventコマンドによりイベントを収集

Webコンソールでシステム状況を統合的に確認

イベントを重要度別にフィルタリングしてメール通知。メールは携帯端末でリアルタイムに確認

イベントはお客様ごとに集約して保存

管理ネットワーク経由でOSや管理ツールにアクセス

管理モジュール(IMM/AMM/HMC)からHWイベントを収集

スイッチ、ストレージ機器、その他機器からのイベントはSNMPトラップで収集

SNMPトラップ

冗長化構成により監視を継続バージョンアップ時にも活用

smcliコマンドで

設定を効率化

NWスイッチ、SANスイッチ、ストレージ機器のイベントはSNMPにより収集

AEMで電圧利用

状況を可視化

シングルポイントから統合監視♪

Page 33: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation33

しすなま!第20回

例)CoDサービスでのイベント通知

イベント自動化プラン(イベント・フィルターとイベント・アクション)を使えば、お客様毎にハードウェア障害を分類して通知できます。

– イベント・ログをお客様毎に出力・保管– 監視対象機器の登録名称をお客様に合わせ変更– メール通知するイベントの条件(対象システム、HWイベント種別・SNMP MIB、重要度)をお客

様毎に設定– メール通知の際は、メール・タイトルにお客様名・重要度を追加して送信

お客様Aログ

監視対象システムイベント

Directorサーバー

お客様Aログ

フィルタ

対象システムの登録名称をお客様に合わせ変更

イベント通知

お客様Bログ

フィルタ

お客様Aログ保存

イベント・フィルター

お客様Bログ保存

イベント・アクション

お客様Bログ

お客様Aメール通知

お客様Bメール通知

お客様Aメールフィルタ

どのお客様で何の障害が発生したかすぐに分かる♪

障害

発生

お客様Bメールフィルタ

イベント自動化プラン

Page 34: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation34

しすなま!第20回

OS死活監視

ツール

例)CoDサービスでのOS死活監視

NW

3分間隔でPingDirectorサーバー 監視対象3回連続で不通通知

不通から回復通知

運用担当不通回数カウント

IPアドレス一覧

Directorの”geneventコマンド”を使えば、OS死活監視情報などもDirectorイベントとして

集約・通知できます。– OS死活監視ツールからDirectorイベント生成コマンド(genevent)を使いイベントを集約

– 任意の監視間隔で任意の回数不通だった場合にイベント生成– 不通状況が改善した場合にイベント生成– イベントの重要度も任意に指定可能

smcli genevent /text:<イベントテキスト> /sev:<重要度>/meid:<システムID>

デフォルト機能にない監視項目でもDirector

に集約できる♪

設定ルール

OS管理ネットワーク経由で3分おきにPing監視を実施。

Ping不通が3回続けばOS障害と判断して通知(約10分程度)

通常のOS再起動時は連続不通回数が1回程度になるため通知されない。

Page 35: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation35

しすなま!第20回

例)CoDサービスでの監視サーバーの冗長化

Directorサーバー(正)

対象サーバーのイベント通知

Directorサーバー(正)の障害を通知

運用担当

正系を監視

ログ保存 対象システム

イベント

ログ保存 Director

サーバー(副)

Directorサーバー(正)

対象サーバーのイベント通知

運用担当

正系を監視

対象システム

イベント

メール通知を有効化 Director

サーバー(副)

障害発生

正常時 障害時

ログ保存

監視システム自身の障害発生、設定変更、メンテナンスの際も監視を継続することができます。の際障害対応する状況でもイベントを収集を継続し、イベントの保存、通知できます。

– Directorサーバーを冗長化(正・副)により構成– イベントの収集、イベントログの保存は正・副のDirectorサーバーで実施– イベントの通知は正系のDirectorサーバーのみからメール通知

• 副系Directorサーバーは正系Directorサーバーを監視し異常時は通知機能を代替

監視システムで障害が発生しても監視は

継続できる♪

Page 36: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation36

しすなま!第20回

例)CoDサービスでの設定効率化定

コマンド操作により効率良く監視設定ができます。– ご利用お客様の変更、システム更新などにより監視設定変更が発生した際などに、Directorの

コマンドライン・インターフェース(smcli)を使えば、変更作業を効率化できます。

#システム・ディスカバリーsmcli discover -i <開始IPアドレス> – <終了IPアドレス>#アクセス要求smcli accesssys -v -u <ユーザID> -p <パスワード> –i <IPアドレス>#インベントリー収集smcli collectinv -i <IPアドレス>#システム登録削除smcli rmsys -v –I <IPアドレス>

# ノード名の変更smcli chsys -n <Director上のノード名> -A DisplayName=<変更後のノード名>

例)システムの登録名称を変更するsmcliコマンド

例)システムの登録・削除をするsmcliコマンド

システムの登録名称変更

CustomerA_nodeXX

CustomerB_nodeXX

イベント自動化プラン管理

•イベント自動化プランイベントフィルターイベントアクション

# イベント自動化プランの削除smcli rmevtautopln -P <自動化プラン名>#イベント自動化プランのエクスポートsmcli lsevtautopln -F xml<自動化プラン名> <エクスポートファイル名(XML)>#イベント自動化プランのインポートsmcli mkevtautopln -C <エクスポートファイル名(XML)>

例)イベント自動化プランを管理するsmcliコマンド

システムの登録・削除

•システム・ディスカバリー•アクセス要求•インベントリー収集•システム登録削除

大規模環境ほどsmcliコマンドが

効率的♪

Page 37: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation37

しすなま!第20回

例)CoDサービスでの消費電力見える化

AEMでサーバーの消費電力や温度をリアルタイムに監視できます。

電力傾向データ(Power Trending)– エネルギー使用量を長期間に

わたってグラフまたは表形式で表示• 日、週、月単位で電力消費量を予測し、適切な「電

力上限値(パワーキャップ)」を決定するのに役立つ

熱傾向データ(Thermal Reporting)– システムの吸気温度と排気温度の

情報を表示• 注意が必要なデータセンター内の“ホットスポット”

を特定するのに役立つ

電力メーターや温度センサーをラックに取り付けなくて良い♪

傾向データの保存期間を設定可能デフォルトでは1年間保存されたデータを期間を指定して表示することも可能

Page 38: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation38

しすなま!第20回

もっと詳しく知りたい方のために・・・

IBM Systems Director スマートシステム管理術– そもそもシステム管理とは?IBM Systems Director ってどういう風に使えばいい

の?といった内容にお答えする IBM Systems Director の教科書です• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-016ADB4

IBM Systems Director 6.2.1 はじめての導入・設定ガイド集– IBM Systems Director 6.2.1をはじめて利用いただく際に役だつ導入ガイド・設定ガ

イドや、主要な情報リンクをまとめています• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-03C6EAF

IBM Systems Director 6.3 FAQ– お客様からよくいただく IBM Systems Director に関するご質問を公開しています

• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-03CB701

Page 39: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation39

しすなま!第20回

第2章:まとめクイズ

Q4.初期セットアップは、IBM ToolsCenterを活用している。

Q5. TPM for OS Deployment で自動プロビジョニング。

Q6. IBM Systems Director で様々な IT プラットフォームの統

合監視が実現できる。

Q7.CoDデリバリーでは、IBM Systems Software をフル活

用している。

??

??

??

??

Page 40: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation40

しすなま!第20回

第3章

PureSystemsによる

クラウド・デリバリーの変化

Page 41: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation41

しすなま!第20回

IBM PureSystems

Expert at:リソースの需要を検知し予測することでインフラの 適化を図ります

• 工場出荷時にシステム・インフラを 適化して統合

• 管理機能の統合

• 専門家の知識・技術による自動化と 適化

Expert at: アプリケーションのデプロイと実行を 適化することで time-to-valueを 小化します

• 専門家の知識・技術によりアプリケーション・レベルの 適化がなされる統合プラットフォーム

• 専門家の知識・技術がベースとなるワークロード・パターン

• コンソールの統合によるシンプルなシステム管理

IaaSの基盤として事前構成済みで導入と保守を自動化・ 適化するインフラストラクチャー・システム

• 設計段階でのハード~ソフトにわたる統合 (Integration by Design)

• エキスパートの高度な知見の組み込み (Built-in Expertise)

• ITライフサイクルのすべてのパートでの簡易化 (Simplified Experience)

2012年5月21日より順次出荷 2012年8月出荷開始予定

Page 42: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation42

しすなま!第20回

工場出荷前に構成とテストを実施

初期導入・設定の効率化 (PureFlexの場合)– 物理的なキッティング

• ノードの構成(CPU、メモリ、I/O増設など)、マウント• 配線作業(電源、LAN、SANなど)

– 導入・Labサービス等でカバーされる初期設定• 管理用アクセスを中心としたノード、ネットワーク、ストレージ初期設定• (一部)仮想化・クラウド管理基盤の初期構成

その後の効率的な構築~運用・保守に利用できる機能の提供– 以下のような後続作業を実施するための、管理・配布機能自体の準備・構築に関わる時間を短縮

• 稼働環境の構築• OSやソフトウェア(稼働イメージ)管理・配布

工場出荷前に構成とテストを実施 70% 設定時間を短縮

Page 43: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation43

しすなま!第20回

PureFlexインフラ管理にかかわるコンポーネントRack

Chassis

Compute Node

同一シャーシ内 HW↓

CMM (Chassis Management Module)

PureFlexラック内 *HW、仮想化基盤

↓FSM (Flex System Manager)

単一コンピュート・ノード HWIMM 2 / FSP

(Integrated Management Module 2)(Flexible Service Processor)

V7000

V7000

V7000

V7000

* 大4シャーシ、年内拡張予定

Page 44: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation44

しすなま!第20回

Flex System Manager (FSM)とは

PureFlex Systemの標準管理ソフトウェアで専用のコンピュートノードで動作します。

大4シャーシまで管理可能 (年内管理可能台数は拡張予定).。

コンピュート・ノード、シャーシ、スイッチモジュールの構成から保守にわたる管理タスクを単一のコンソールから実行可能です。

以下の基本機能を提供します。– 構成管理– 監視 &イベント管理– リモート操作– コールホーム

– パッケージ更新– ストレージ装置、ネットワーク装置の一元管理– 異種複数の仮想化&プラットフォーム環境のライフサイクル管理 (仮想サーバーの電源制御・作成・再配置)

さらにAdvanced Featureにより以下の仮想管理機能を提供します– イメージ管理– プロビジョニング (リソース・プール)

専門開発チームによりユーザーエクスペリエンスが強化されており、異種混合・大規模なクラウド環境下でも手早く効率的な管理操作をサポートします。

– Chassis Map– Global Finder

44

Page 45: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation45

しすなま!第20回

例)FSMによる電源制御

Resource Explorerで複数のノードを選択

Actionsから選択したノードの電源を一斉ON/OFF

お客様別に管理対象サーバーをグループ

分けできる♪

Page 46: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation46

しすなま!第20回

例) FSMによるファームウェア更新

Step 1:インターネットorローカルから

新のファームウェアを導入

Step 2:更新対象のノードを選択し、一括でアップデート

コンプライアンス・ポリシーを設定すれば自動アップデートできる♪

Page 47: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation47

しすなま!第20回

例) FSMによるネットワーク機器設定

Configuration TemplateとしてVLAN構成テンプレートを作成

サーバー担当者でもネットワーク設定ができる♪

Page 48: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation48

しすなま!第20回

例) FSMによるストレージ構成管理

構成情報/インベントリーを収集・管理

1クリックで各機器の専用コンソールを起動

外部ストレージ装置を把握

複数のストレージも集中管理できる♪

Page 49: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation49

しすなま!第20回

例)CMMからリシート(Re-seat)

シャーシからコンピュート・ノードやスイッチへの電力供給をカットするAC Power Off(リシート)をリモートから行な

えます。– Service and Support > Advanced >

• Service Resetタブ > CMM, スイッチ, FSM, コンピュート・ノードからいずれか1つを選択• Reset > Virtual Re-seat

ブレードでは、エラーなどの表示が消えないなど、どうしてもリセットが必要になった場合、シャーシからの抜き差しを現場で実施していた。

サーバー抜き差しするのに現地に行かなくて良い♪

Page 50: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation50

しすなま!第20回

CoDとPureSystemsの運用管理比較

Flex System ManagerのNetwork Control機能で

障害監視

IBM Systems DirectorのプラグインであるNetwork Control機能による障害監視

Flex System ManagerのConfiguration Manager機能で設定(PureSystemsではデフォルトで管理用VLANが設定済みのため、すぐにFSMにアクセスできる)

各ネットワーク機器にログインし、CLIによる設定もしくはTFTPサーバーからの設定ファイル流し込み

ネットワーク機器設定

Flex System ManagerのConfiguration Manager機能で設定参照・変更構成テンプレートの活用による一括適用

Advanced Settings Utilityを使って、PowerShellスクリプトから一括設定参照・変更

BIOS/uEFIの設定参照・変更

該当なし

※仮想OSはVMcontrolで管理

IBM Systems Director製品群であるOS Deploying機能を使いOSのベアメタル配布を実施

OSベアメタル配布プロビジョニング

Flex System ManagerのUpdate Manager機能で

シャーシおよびノードのファームウェア更新を一括管理

Server Guide/Bootable Media Creatorでファームウェアイメージを作成し、それらをPXEサーバーか

らネットワーク展開

ファームウェア更新

IBM Systems Director製品群であるOS Deploying機能におけるソフトウェア・パッケージ機能を使いOSと共にソフトウェア配布を実施

ソフトウェア配布

Flex System Managerから一括で電源ON/OFFを実施(IPMIも使用可能。)

IPMIutilをスクリプトで呼び出し、一括で電源ON/OFFを実施

電源制御初期セットアップ

Flex System ManagerのStrage Control機能を使

い、ストレージのリソース利用状況をモニタリング

IBM Systems Director Storage Controlを使い、

ストレージのリソース利用状況をモニタリングストレージ管理

該当なしIBM System Networking Element Managerによりsyslogのイベント集計実施

ネットワーク監視

Flex System ManagerからIMM/CMMをディスカバ

リーしてアウトオブバンド監視を実施

Systems DirectorからIMM/AMMをディスカバリー

してアウトオブバンド監視を実施ハードウェア監視モニタリング

PureSystemsの運用管理CoDでの運用管理作業項目フェーズ

Page 51: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation51

しすなま!第20回

PureSystemsによる運用面での変化

インフラ運用管理を自動化するための仕組みが出荷時から組み込まれています。

GUIベースの操作で専門スキルがなくても比較的簡単に運用管理ができます。

これまでのSystems Softwareのスキルセットが活用できます。

IPMIUtilなど

利用ツール

電源制御

必要作業

BoMCFW更新

BoFM構成管理

VMControlイメージ管理

Flex System Manager

該当する操作を組み込みのFSMから実施可能従来は個別に対応操作のためのツールを準備・構成

PureSystemsPureSystemsの利用によりさらなる運用効率向上が期待できますの利用によりさらなる運用効率向上が期待できます

Page 52: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation52

しすなま!第20回

第3章:まとめクイズ

Q8.PureFlex System用シャーシーであるIBM Flex System Enterprise シャーシには、14 台のサーバーマウントできる。

Q9.PureFlexは FSM (Flex System Manager) から一元管理

できる。

Q10.Expert Integrated Systems とは「エキスパートが持つ高

度な知見を実装」した新たな製品カテゴリ。

??

??

??

Page 53: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation53

しすなま!第20回

Page 54: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation54

しすなま!第20回

参考:SNEMによるネットワーク機器のイベント監視

Page 55: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation55

しすなま!第20回

Install- Physical- Firmware- Configuration- Advanced PD

Monitoring- Monitoring- Initial PD- Automation

BLADE Harmony ManagerBLADE Harmony ManagerBNT Switch Management BNT Switch Management

Tivoli Network ManagerTivoli Network Manager

Tivoli Tivoli NetcoolNetcoolConfiguration ManagerConfiguration Manager

Netcool/OMNIbusNetcool/OMNIbus

IBM Systems Networking Element Manager (SNEM)によるネットワーク監視集約

SNEMSNEM

SNEMは従来のネットワーク・ソフトウェアが統合されたSystems Softwareです。

Page 56: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation56

しすなま!第20回

例)syslogイベント集計

Syslogパーサー(syslog.rules)をカスタマイズすることでイベントごとのSeverityや表示方法を変更可

・Severityごとに色分けして表示・同種のイベントはまとめてCountで表示・その他発生日時、発生したノードなどによってソート可能

イベントの重要度やどういうイベントの発生頻度

が一目で分かる♪

アラートをもっと統計的に把握したい。

Page 57: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation57

しすなま!第20回

例)ホスト名の変換

どのノードで発生したイベントかすぐ

に分かる♪

ホスト名やIPアドレスだと直感的に分かりにくい。

192.168.10.10・・・

JMX1SC01A・・・

SNEMのトリガー機能を使い、イベントリストで表示されるノード名を分かりやすい名前に変換

Page 58: 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM Systems Softwareを活用した運用自動化のご紹介」(2012/09/20

© 2012 IBM Corporation58

しすなま!第20回

例)サーバー再起動によるアラート通知の抑止port downイベントが起きてから5分後にアラート通知

しかし5分以内に同ポートでport upイベントが発生した場合、トリガー機能でアラート通知を取りやめる

再起動のたびに発生するアラート通知を抑止できる♪

サーバー再起動のたびにNWアラート通知を抑

止するのは大変。