第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM...
-
Upload
system-x-lenovo-enterprise-solutions-ltd -
Category
Technology
-
view
717 -
download
0
description
Transcript of 第20回「事件は現場で起きている!IBMクラウド”CoDサービス”実運用の現場より、IBM...
© 2012 IBM Corporation
IBMクラウド”CoDサービス”実運用の現場より
IBM Systems Softwareを活用した運用自動化のご紹介
しすなま!第20回
日本アイ・ビー・エム株式会社 STG. PureSystems Solution 佐々木 敦守日本アイ・ビー・エム株式会社 STG. Linux/OSS & Cloud Support Center 阿部純一郎
Revision 1.0
© 2012 IBM Corporation2
しすなま!第20回
はじめに
この資料の内容に関しては正式なIBM のテストを受けておりません。この資料は、資料
作成時における 新情報をご参考のために提供することを目的として記載されており、IBMは、情報の正確性、完全性または有用性について何ら保証するものではありませ
ん。また、内容は予告なしに変更または更新されることがあります。
この資料の内容は、限られた検証環境における結果に基づくものであり、全ての環境で同一の結果を保証するものではありません。お客様固有の環境に対し、適切であるかどうか、また、正確であるかどうかは十分検証されていません。この資料の情報に基づき導入・設定を実施される場合には、十分な検証テストを行ってください。また、予め製品のマニュアルおよびディストリビューターが提供する情報をご覧ください。
この資料の情報に基づいて導入・設定・運用した結果について、IBMはいかなる保証も
責任も負いかねますので予めご了承ください。
© 2012 IBM Corporation3
しすなま!第20回
特記事項および商標
本文書の内容は、特に記載の無い限り、2012年9月20日現在に公開されている文書に基づいています。
本文書において、IBM 製品、プログラム、およびサービスについて言及する場合がありますが、このことはこのような IBM 製品、プログラ ム、およびサービスが IBM が企業活動を行っているすべての国で使用できることを意味するものではありません。本文書で、IBM 製品、プログラム又はサービスに言及する部分があっても、このことは当該製品、プログラム、またはサービスのみが使用可能であることを意味するものではありません。これらのIBM製品、プログラム、またはサービスに代えて、IBM の知的所有権を侵害することのない機能的に同等のプログラムを使用することができます。
本文書に記載されている情報の使用または手法の実施は、お客様の評価および使用している動作環境への統合能力にしたがって、お客様の責任で行っていただきます。記載されている情報はいずれもIBMにより、特定の状況における正確さは確認されているはずですが、いかなる環境においてもそれと同じ、あるいは同様な結果が得られるとは限りません。お客様独自の環境において、これらの手法を適用する場合は、お客様の責任で行っていただきます。
商標– IBM はInternational Business Machines Corporation の登録商標– IBM System は International Business Machines Corporation の商標– System z は International Business Machines Corporation の商標– System x は International Business Machines Corporation の商標– Power Systems は International Business Machines Corporation の商標– BladeCenter は International Business Machines Corporation の商標– iDataPlexは International Business Machines Corporation の商標– IBM Systems Director Active Energy Managerは International Business Machines Corporation の登録商標– Systems Director VMControl は International Business Machines Corporation の商標– AIX は International Business Machines Corporation の登録商標– AIX 6 はInternational Business Machines Corporation の商標– AIX 7 はInternational Business Machines Corporation の商標– POWER6 は International Business Machines Corporation の商標– POWER7 は International Business Machines Corporation の商標– IBM i5/OS は International Business Machines Corporation の商標– EnergyScale は International Business Machines Corporation の商標– VMware vCenter Serverは、VMware Incorporationの商標– Windowsは、Microsoft Corporationの米国およびその他の国における登録商標– Intel, Pentium は Intel Corporation の米国およびその他の国における登録商標– Linux は、Linus Torvalds の米国およびその他の国における登録商標– その他、本文書で使用するシステム名、製品名、会社・団体の名称はそれぞれ各社の商標または登録商標です
© 2012 IBM Corporation4
しすなま!第20回
更新履歴
– 2012年 9月 20日 初版 (Rev. 1.0) 発行
© 2012 IBM Corporation5
しすなま!第20回
本日の内容
1. IBMクラウド・オファリングCoDのご紹介
2. IBM Systems Softwareによるクラウド・デリバリーの自動化– 初期セットアップ編– プロビジョニング編– モニタリング編
3. PureSystemsによるクラウド・デリバリーの変化
System xのさらなる運用効率化のヒントに。
運用観点でのSystem xの優位性を再確認。
© 2012 IBM Corporation6
しすなま!第20回
第1章
IBMクラウド・オファリングCoDのご紹介
© 2012 IBM Corporation7
しすなま!第20回
(ご参考)http://www.ibm.com/ibm/jp/cloud/solutions/
IBM SmarterCloud ポートフォリオ (2012年9月現在)
© 2012 IBM Corporation8
しすなま!第20回
IBM Computing on Demand (CoD) とは
IBM CoDセンターお客様お客様
(ご参考)http://www.ibm.com/systems/jp/deepcomputing/DCCoD/
専用線専用線 / VPN
/ VPN
IBM Computing on Demand (CoD) はIBMのIaaS型クラウド・オファリングです。
新のIBMサーバー
高速ネットワーク
物理サーバー専有型
HighPerformance
Secure
On Demand
High PerformanceHigh Performance
On DemandOn Demand
SecureSecure
すぐに利用可能
従量課金
高拡張性
国内IBMデータセンター
専用線/VPNによるアクセス
VLANセキュリティ
© 2012 IBM Corporation9
しすなま!第20回
CoDサービス適用業界
業界業界 アプリケーションの例アプリケーションの例
金融 リスク分析ポートフォリオおよび財産管理デリバティブ・シミュレーション
デジタル・メディア CGレンダリング
学術 数値解析
建築 構造解析流体計算
製造 CAD (Computer Aided Design)CAE (Computer Aided Engineering)EDA (Electronic Design Automation)
放送 コンテンツ管理システム
その他 開発・テストベンチマーク
CoD は大規模な計算リソースを必要とするHigh Performance Computing (HPC)分野のお客様を中心にご利用いただいております。
(ご参考)http://www.ibm.com/systems/jp/deepcomputing/DCCoD/solution.html
© 2012 IBM Corporation10
しすなま!第20回
第1章:まとめクイズ
Q1.CoDは、IBM SmarterCloud ポートフォリオにおける
マネージド・クラウド・サービス の1つである。
Q2. CoDは、物理サーバー 専有型のサービスである。
Q3. CoDは、主に HPC 分野のお客様に広く利用されている。
??
??
??
© 2012 IBM Corporation11
しすなま!第20回
第2章
IBM Systems Softwareによる
クラウド・デリバリーの自動化
© 2012 IBM Corporation12
しすなま!第20回
CoDサービスのデリバリー・プロセス概要
初期初期セットアップセットアップ
プロビジョニングプロビジョニング モニタリングモニタリング
•電源制御
•Firmware更新
•uEFI/BIOS設定
•OS導入/構成
•SW導入/構成
•インフラ監視
•障害対応
初期初期セットアップセットアップ
プロプロビジョニングビジョニング
モニモニタリングタリング
初期初期セットアップセットアップ
プロプロビジョニングビジョニング
モニモニタリングタリング
金融シミュレーションの計算基盤としてBladeCenterを3年間使いたい。
構造解析システムの基盤としてiDataPlexを半年間使いたい。
CGレンダリング用に 新のGPGPUマシンを3ヶ月使いたい。
A証券様
B建設様
Cアニメーション様
© 2012 IBM Corporation13
しすなま!第20回
CoDサービス・デリバリーにおける課題の整理
大規模分散環境– 数百台から数千台のサーバーで構成される。– x86サーバーが主である。
– 複数のデータセンターに点在する。
ヘテロジニアス– お客様毎に利用機種が異なる– お客様毎、導入時期毎に利用OS種類やそのバージョン
が異なる。– スイッチ、ストレージも管理対象。
マルチテナンシー– 複数のお客様が入れ替わり立ち替わり利用するためシ
ステム変更頻度が高い。– システム変更のサイクルが比較的短い。– 同時に複数のお客様にサービスを提供する。
効率的に管理したい
統合的に管理したい
正確に管理したい
© 2012 IBM Corporation14
しすなま!第20回
初期セットアップ電源制御
uEFI/BIOS, IMM設定
システム情報の収集
FW更新
プロビジョニングOSのインストール
ソフトウェアのインストール
OS・ソフトウェアの設定
モニタリングサーバー
ネットワーク
ストレージ
IBM Computing on DemandIBM Computing on Demand
CoDサービスを支えるIBM Systems Software
IBM ToolsCenter- Advanced Setting Utility- Bootable Media Creator
IBM Systems DirectorSNEM
CoDサービス・デリバリーでは各フェーズでSystems Directorを中心とするIBM Systems Softwareをフル活用しております。
© 2012 IBM Corporation15
しすなま!第20回
初期セットアップ編
© 2012 IBM Corporation16
しすなま!第20回
データセンターに大量のサーバーが搬入された・・・
1人でいい?
来週までにお願い。
何台あるんだろう・・・
uEFI/IMMの設定変更箇所が多いな・・・
電源制御が大変そう・・・
ファームウェアを全て 新にしなきゃ・・・
了解です・・・
リーダー
デリバリー担当
構成管理表もいるな・・・
データセンターは寒そう・・・
パラメーター・シートどおりにやってね。
© 2012 IBM Corporation17
しすなま!第20回
例)CoDサービスでの電源制御
IPMI Management Utilitiesを使えば、管理対象サーバーの電源制御を自動化できます。– System x製品のシステム管理プロセッサーであるIMM2は、業界標準管理インターフェース
IPMI (Intelligent Platform Management Interface) Version 2.0をサポートしています。– IPMIutilは、IPMIを管理および構成するのに使用できるさまざまなツールを提供します。
– インバンド/アウト・オブ・バンドを使用して、リモートから操作することができます
※IPMI Management Utilitiesの詳細について、あるいはIPMIutilをダウンロードするには、
http://ipmiutil.sourceforge.net/ にアクセスしてください。
IMM管理用LAN
ipmiutil reset -N <IMM_IP> -U <IMM_USER> -P <IMM_PASSWORD> -uipmiutil reset -N <IMM_IP> -U <IMM_USER> -P <IMM_PASSWORD> -dipmiutil reset -N <IMM_IP> -U <IMM_USER> -P <IMM_PASSWORD> -c
ON OFF Restart
リモート電源制御
電源ボタンは押さなくて
よい♪
IPMIutil
IMM
© 2012 IBM Corporation18
しすなま!第20回
例)CoDサービスでのuEFI/IMM設定
リモートuEFI/IMM管理
▼設定変更asu set uEFI.OperatingMode "Performance Mode" --host <IMM_IP> --user <IMM_USER> --password <IMM_PASSWORD>
▼設定参照asu show all --host <IMM_IP> --user <IMM_USER> --password <IMM_PASSWORD> > <IMM_IP>_showall_log.txt
IBM Advanced Settings Utility (ASU)を使えば、管理対象サーバーのuEFI/IMMの設定
変更を自動化できます。– ASUは、uEFI/IMMなどの設定が可能なコマンドラインツールです。– ASUはIBMが提供するフリーツールです。– 設定内容はファイル形式で保存/リストアすることができます。
※ASUの詳細について、あるいはASUをダウンロードするには、http://www.ibm.com/support/entry/portal/docdisplay?lndocid=TOOL-ASU/ にアクセスして
ください。
IMM管理用LANF1起動は
不要♪
設定情報収集も簡単♪
show set save
ASU
© 2012 IBM Corporation19
しすなま!第20回
例)CoDサービスでのファームウェア更新
Diag NIC
BIOS
ServeRAID
HDD
Bootabe Image
PXE files
IBM ToolsCenter Bootable Media Creator (BoMC)とPXEサーバーを使えば簡単に
ファームウェア更新ができます。– BoMCは、簡単なGUI操作でファームウェアを一括更新するメディアを作成するSystem xおよ
びBladeCenterのツールです。– さらにPXEサーバー を使えば、BoMCで作成したメディアを、ネットワーク経由でターゲットマシ
ンに配布することができます。
※BoMCの詳細について、 あるいはBoMCをダウンロードするには、http://www.ibm.com/support/entry/portal/docdisplay?lndocid=TOOL-BOMC、およびhttp://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-00B98A0 にア
クセスしてください。更新結果のログ回収も簡単♪
PXE
IMM管理用LAN
Log
ファームウェア一括更新
© 2012 IBM Corporation20
しすなま!第20回
もっと詳しく知りたい方のために・・・
IBM システム管理 - IBM ToolsCenterのご紹介 - Japan– IBM System x/BladeCenterの導入やメンテナンスを支援するIBM ToolsCenterによる初期導
入、設定、更新、問題判別など、サーバー運用管理の方法が解説されています。• http://www.ibm.com/systems/jp/x/sysmanage/toolscenter.shtml
IBM ToolsCenter 機能説明資料– IBM ToolsCenterの各ツールについて、その概要および機能について記載されています。
• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-027181B
Integrated Management Module II (IMM2) 関連 FAQ– 本FAQでは特に、IBM System xおよびIBM BladeCenterにおけるIMM2に関連したQ&Aをま
とめています。• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-037ABAB
Integrated Management Module II (IMM2) 操作ガイド– 本資料はIMM 2(Integrated Management Module 2)の操作について記載されたガイドです。
• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-03F54F2
© 2012 IBM Corporation21
しすなま!第20回
プロビジョニング編
© 2012 IBM Corporation22
しすなま!第20回
大量の物理サーバーにOSをインストールしたい・・・
OS導入・設定もよろしく
ソフトウェアもね。
サーバー毎に利用OSが違う
OSのネットワーク設定大変そう・・・
ソフトウェアも・・・
了解です・・・
パラメーター・シートどおりにやってね。
リーダー
サーバー配置とIPアドレスの順番を合わせて管理したい。
数百台はある・・・
デリバリー担当
来週までにお願い。
© 2012 IBM Corporation23
しすなま!第20回
IBM Systems Director Editions for x86 の製品ラインアップ
Storage Control 4.2.1.1 は Systems Director Editions に含まれませんVMControl Enterprise Edition for x86 は Systems Director Editions に含まれません(VMControl Express Edition のみ含まれます)
金額など詳細な情報はこちらをご参照ください– IBM Systems Director Editions v6.3 製品構成とライセンス価格のガイド– https://www.gosavo.com/Document/Document.aspx?id=2417586
○Upward Integration for Microsoft System Center 3.1
○(有無選択可)Virtual Media Key
1年または3年間の
ソフトウェアサポート
○
○
○
○
Express Edition
1年または3年間の
ソフトウェアサポート保守サポート(サブスクリプション&サポート)
Systems Director
大消費電力値設定
消費電力・温度測定
○Upward Integration for VMware vSphere 1.1○Tivoli Provisioning Manage for OS Deployment 7.1.1○Network Control 1.3○Service and Support Manager 6.3○VMControl Express Edition 2.4○
○Active Energy Manager 4.4
○Systems Director 6.3
Standard EditionSystems Director 構成要素
© 2012 IBM Corporation24
しすなま!第20回
Tivoli Provisioning Manager for OS Deployment
GUI操作で簡単♪
TPMfOSDを使えば効率的にOSプロビジョニングができます。– 簡単なWeb ベースのコンソールにより簡単にどこからでも操作可能。– 様々なハードウェア機種をサポート(Systems x、iDataPlex, BladeCenter,
System p)– 様々なOSプロビジョニングをサポート(Windows、Linux、VMware ESX)
– ソフトウェアも同時にプロビジョニング可能(ソフトウェア・パッケージ機能)– マルチキャストでスピーディーにプロビジョニング。– 既存の参照マシンからOSイメージをキャプチャーすることも可能。
TPM
TPMサーバー管理対象マシン
OSイメージLinuxLinux
WindowsWindows
VMwareVMwareリモート・
プロビジョニング
© 2012 IBM Corporation25
しすなま!第20回
例)CoDサービスでのOSイメージ管理
Windows 2003
Windows 2008
Software B
Software A
Linux
Config 2
Config 1
×
Linux
Software AConfig 1
Windows 2003
Windows 2008
Software AConfig 2
Config 2Software B
Software A
OSプレーン
イメージ
お客様A
お客様B
お客様C
TPMfOSDはお客様要件に応じて、必要なOSイメージにOS設定やソフトウェアのパッケージを組み合わせることで、複数のパターンのOSイメージを効率的に生成できます。– OS標準インストール・イメージをプレーンイメージとして保管– お客様要件に応じたOS構成ファイル・スクリプトをパッケージとして作成
– お客様要件に応じたソフトウェア・メディアをパッケージとして作成
ソフトウェアパッケージ
OS構成スクリプト
マスターイメージ
効率的にOSイメージ
を作成♪
ソフトウェアイメージ
© 2012 IBM Corporation26
しすなま!第20回
26
例)CoDサービスでのサーバー配置管理
Linuxの場合– host 宣言文の中の hardware ethernet パラ
メータと fixed-address パラメータを使用することで、ネットワークカードの MAC アドレスに IP アドレスを割り当てます。これにより、ラック内のサーバの物理位置とIPアドレスをマッピングでき
管理効率が向上します。
Windowsの場合– Linuxの場合(前頁)と同様の設定が、[スター
ト] [管理] [DHCP]により設定できます。
– 例) netshコマンドを使用して、スコープ”172.16.0.0”内でMACアドレスとIPアドレス172.16.0.101の紐づけを実施
数百台規模のクラスタにOSプロビジョニングを実施する場合、構成管理効率化のため、ラック内の物理的な位置とDHCPから割り振られるIPアドレスの紐付けを実施し順番を揃えることを推奨します。
> netsh DHCP server scope 172.16.0.0 add reservedip 172.16.0.101 MACアドレス iData01 “” both
スクリプトで一括設定すればいいね♪
© 2012 IBM Corporation27
しすなま!第20回
もっと詳しく知りたい方のために・・・
製品・サービス発表レター– IBM Tivoli Provisioning Manager for OS Deployment V7.1.1の発表の機能一覧
を確認できます。• http://www.ibm.com/jp/domino02/NewAIS/aisextr.nsf/ByLetterNo/TIV09048?OpenDo
cument
Tivoli Provisioning Manager for OS Deployment 7.1.1 導入・操作ガイド– 導入・設定方法や、Windows/Linux/VMware ESXのOSの配布手順をステップ バイ
ステップで紹介しています。• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-022C912
TPM 7.2による クラスター構築と実践テクニック– OSおよびソフトウェアのプロビジョニングを Tivoli Provisioning Manager V7.2 を使
用した IBM社内での運用経験をまとめた資料です。• http://www.ibm.com/software/jp/tivoli/tech/00512d7b.html
© 2012 IBM Corporation28
しすなま!第20回
モニタリング編
© 2012 IBM Corporation29
しすなま!第20回
大規模なハードウェア基盤をどう監視するか?
サーバー、NW、ストレージ
の監視もよろしく。
サーバー・モデルは様々・・・
障害をどう通知しよう・・・
NWスイッチも・・・
SAN環境も・・・
了解です・・・ リーダー
監視対象が複数データセンターに点在する・・・
デリバリー担当
人的リソースは限られている。
通知漏れがないように。
要員はこれ以上増やせない。
© 2012 IBM Corporation30
しすなま!第20回
ヘテロジニアスヘテロジニアス
CoDハードウェア基盤の特徴と監視要件の整理
• サーバー:System x、BladeCenteriDataPlex、System p
• スイッチ: Cisco、BNT• ストレージ: DS、XIV
統合的な監視統合的な監視• 多種多様な機器からの
各々のイベントを集約できる
• システム全体の状況を一覧できる
継続性ある監視継続性ある監視
• サービスに影響なく監視設定変更ができる
• 可用性のある監視サービスを提供できる。
迅速な通知迅速な通知
• 障害発生時にリアルタイムに確認できる。
• どのお客様のどの環境で障害があったかをすぐに識別できる。
マルチテナンシーマルチテナンシー
• 複数のお客様へのサービス提供
• 異なる利用期間
大規模分散環境大規模分散環境
• サーバー: 数百台~• ストレージ: 数十台~• 設置場所: 数箇所~
© 2012 IBM Corporation31
しすなま!第20回
IBM Systems Director で様々な IT プラットフォームの統合管理が実現できます
IBM Systems Directorサーバー
監視対象ストレージ装置 / FC スイッチ
SMI-S プロバイダー
API
ストレージ機器の管理Storage Control
ネットワーク機器の管理Network Control
SNMP
監視対象ネットワークスイッチ
IBM BLADE Harmony Manager
ハイパーバイザーや仮想サーバーの管理VMControl
Hyper-V VMware ESX KVM
監視対象仮想ネットワークスイッチ
API
API
サーバーの管理Systems Director
System z, Power SystemsSystem x, BladeCenter
IBM Systems Director ではさまざまな IT プラットフォームの
統合管理を行うことを目指しています
IBM Systems Director ではさまざまな IT プラットフォームの
統合管理を行うことを目指しています
SMI-S
PowerVM z/VM
© 2012 IBM Corporation32
しすなま!第20回
CoDサービスでのSystems Director監視全体像
死活監視
ツール
IBM CoD センター
お客様A
管理NW
管理NW
管理NW
運用担当
IMM
AMM
IMM
ネットワーク
お客様B
お客様C
死活監視ツールでPing監視を実施。geneventコマンドによりイベントを収集
Webコンソールでシステム状況を統合的に確認
イベントを重要度別にフィルタリングしてメール通知。メールは携帯端末でリアルタイムに確認
イベントはお客様ごとに集約して保存
管理ネットワーク経由でOSや管理ツールにアクセス
管理モジュール(IMM/AMM/HMC)からHWイベントを収集
スイッチ、ストレージ機器、その他機器からのイベントはSNMPトラップで収集
SNMPトラップ
冗長化構成により監視を継続バージョンアップ時にも活用
smcliコマンドで
設定を効率化
NWスイッチ、SANスイッチ、ストレージ機器のイベントはSNMPにより収集
AEMで電圧利用
状況を可視化
シングルポイントから統合監視♪
© 2012 IBM Corporation33
しすなま!第20回
例)CoDサービスでのイベント通知
イベント自動化プラン(イベント・フィルターとイベント・アクション)を使えば、お客様毎にハードウェア障害を分類して通知できます。
– イベント・ログをお客様毎に出力・保管– 監視対象機器の登録名称をお客様に合わせ変更– メール通知するイベントの条件(対象システム、HWイベント種別・SNMP MIB、重要度)をお客
様毎に設定– メール通知の際は、メール・タイトルにお客様名・重要度を追加して送信
お客様Aログ
監視対象システムイベント
Directorサーバー
お客様Aログ
フィルタ
対象システムの登録名称をお客様に合わせ変更
イベント通知
お客様Bログ
フィルタ
お客様Aログ保存
イベント・フィルター
お客様Bログ保存
イベント・アクション
お客様Bログ
お客様Aメール通知
お客様Bメール通知
お客様Aメールフィルタ
どのお客様で何の障害が発生したかすぐに分かる♪
障害
発生
お客様Bメールフィルタ
イベント自動化プラン
© 2012 IBM Corporation34
しすなま!第20回
OS死活監視
ツール
例)CoDサービスでのOS死活監視
NW
3分間隔でPingDirectorサーバー 監視対象3回連続で不通通知
不通から回復通知
運用担当不通回数カウント
IPアドレス一覧
Directorの”geneventコマンド”を使えば、OS死活監視情報などもDirectorイベントとして
集約・通知できます。– OS死活監視ツールからDirectorイベント生成コマンド(genevent)を使いイベントを集約
– 任意の監視間隔で任意の回数不通だった場合にイベント生成– 不通状況が改善した場合にイベント生成– イベントの重要度も任意に指定可能
smcli genevent /text:<イベントテキスト> /sev:<重要度>/meid:<システムID>
デフォルト機能にない監視項目でもDirector
に集約できる♪
設定ルール
OS管理ネットワーク経由で3分おきにPing監視を実施。
Ping不通が3回続けばOS障害と判断して通知(約10分程度)
通常のOS再起動時は連続不通回数が1回程度になるため通知されない。
© 2012 IBM Corporation35
しすなま!第20回
例)CoDサービスでの監視サーバーの冗長化
Directorサーバー(正)
対象サーバーのイベント通知
Directorサーバー(正)の障害を通知
運用担当
正系を監視
ログ保存 対象システム
イベント
ログ保存 Director
サーバー(副)
Directorサーバー(正)
対象サーバーのイベント通知
運用担当
正系を監視
対象システム
イベント
メール通知を有効化 Director
サーバー(副)
障害発生
正常時 障害時
ログ保存
監視システム自身の障害発生、設定変更、メンテナンスの際も監視を継続することができます。の際障害対応する状況でもイベントを収集を継続し、イベントの保存、通知できます。
– Directorサーバーを冗長化(正・副)により構成– イベントの収集、イベントログの保存は正・副のDirectorサーバーで実施– イベントの通知は正系のDirectorサーバーのみからメール通知
• 副系Directorサーバーは正系Directorサーバーを監視し異常時は通知機能を代替
監視システムで障害が発生しても監視は
継続できる♪
© 2012 IBM Corporation36
しすなま!第20回
例)CoDサービスでの設定効率化定
コマンド操作により効率良く監視設定ができます。– ご利用お客様の変更、システム更新などにより監視設定変更が発生した際などに、Directorの
コマンドライン・インターフェース(smcli)を使えば、変更作業を効率化できます。
#システム・ディスカバリーsmcli discover -i <開始IPアドレス> – <終了IPアドレス>#アクセス要求smcli accesssys -v -u <ユーザID> -p <パスワード> –i <IPアドレス>#インベントリー収集smcli collectinv -i <IPアドレス>#システム登録削除smcli rmsys -v –I <IPアドレス>
# ノード名の変更smcli chsys -n <Director上のノード名> -A DisplayName=<変更後のノード名>
例)システムの登録名称を変更するsmcliコマンド
例)システムの登録・削除をするsmcliコマンド
システムの登録名称変更
CustomerA_nodeXX
CustomerB_nodeXX
イベント自動化プラン管理
•イベント自動化プランイベントフィルターイベントアクション
# イベント自動化プランの削除smcli rmevtautopln -P <自動化プラン名>#イベント自動化プランのエクスポートsmcli lsevtautopln -F xml<自動化プラン名> <エクスポートファイル名(XML)>#イベント自動化プランのインポートsmcli mkevtautopln -C <エクスポートファイル名(XML)>
例)イベント自動化プランを管理するsmcliコマンド
システムの登録・削除
•システム・ディスカバリー•アクセス要求•インベントリー収集•システム登録削除
大規模環境ほどsmcliコマンドが
効率的♪
© 2012 IBM Corporation37
しすなま!第20回
例)CoDサービスでの消費電力見える化
AEMでサーバーの消費電力や温度をリアルタイムに監視できます。
電力傾向データ(Power Trending)– エネルギー使用量を長期間に
わたってグラフまたは表形式で表示• 日、週、月単位で電力消費量を予測し、適切な「電
力上限値(パワーキャップ)」を決定するのに役立つ
熱傾向データ(Thermal Reporting)– システムの吸気温度と排気温度の
情報を表示• 注意が必要なデータセンター内の“ホットスポット”
を特定するのに役立つ
電力メーターや温度センサーをラックに取り付けなくて良い♪
傾向データの保存期間を設定可能デフォルトでは1年間保存されたデータを期間を指定して表示することも可能
© 2012 IBM Corporation38
しすなま!第20回
もっと詳しく知りたい方のために・・・
IBM Systems Director スマートシステム管理術– そもそもシステム管理とは?IBM Systems Director ってどういう風に使えばいい
の?といった内容にお答えする IBM Systems Director の教科書です• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-016ADB4
IBM Systems Director 6.2.1 はじめての導入・設定ガイド集– IBM Systems Director 6.2.1をはじめて利用いただく際に役だつ導入ガイド・設定ガ
イドや、主要な情報リンクをまとめています• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-03C6EAF
IBM Systems Director 6.3 FAQ– お客様からよくいただく IBM Systems Director に関するご質問を公開しています
• http://www.ibm.com/jp/domino04/pc/support/Sylphd07.nsf/jtechinfo/SYJ0-03CB701
© 2012 IBM Corporation39
しすなま!第20回
第2章:まとめクイズ
Q4.初期セットアップは、IBM ToolsCenterを活用している。
Q5. TPM for OS Deployment で自動プロビジョニング。
Q6. IBM Systems Director で様々な IT プラットフォームの統
合監視が実現できる。
Q7.CoDデリバリーでは、IBM Systems Software をフル活
用している。
??
??
??
??
© 2012 IBM Corporation40
しすなま!第20回
第3章
PureSystemsによる
クラウド・デリバリーの変化
© 2012 IBM Corporation41
しすなま!第20回
IBM PureSystems
Expert at:リソースの需要を検知し予測することでインフラの 適化を図ります
• 工場出荷時にシステム・インフラを 適化して統合
• 管理機能の統合
• 専門家の知識・技術による自動化と 適化
Expert at: アプリケーションのデプロイと実行を 適化することで time-to-valueを 小化します
• 専門家の知識・技術によりアプリケーション・レベルの 適化がなされる統合プラットフォーム
• 専門家の知識・技術がベースとなるワークロード・パターン
• コンソールの統合によるシンプルなシステム管理
IaaSの基盤として事前構成済みで導入と保守を自動化・ 適化するインフラストラクチャー・システム
• 設計段階でのハード~ソフトにわたる統合 (Integration by Design)
• エキスパートの高度な知見の組み込み (Built-in Expertise)
• ITライフサイクルのすべてのパートでの簡易化 (Simplified Experience)
2012年5月21日より順次出荷 2012年8月出荷開始予定
© 2012 IBM Corporation42
しすなま!第20回
工場出荷前に構成とテストを実施
初期導入・設定の効率化 (PureFlexの場合)– 物理的なキッティング
• ノードの構成(CPU、メモリ、I/O増設など)、マウント• 配線作業(電源、LAN、SANなど)
– 導入・Labサービス等でカバーされる初期設定• 管理用アクセスを中心としたノード、ネットワーク、ストレージ初期設定• (一部)仮想化・クラウド管理基盤の初期構成
その後の効率的な構築~運用・保守に利用できる機能の提供– 以下のような後続作業を実施するための、管理・配布機能自体の準備・構築に関わる時間を短縮
• 稼働環境の構築• OSやソフトウェア(稼働イメージ)管理・配布
工場出荷前に構成とテストを実施 70% 設定時間を短縮
© 2012 IBM Corporation43
しすなま!第20回
PureFlexインフラ管理にかかわるコンポーネントRack
Chassis
Compute Node
同一シャーシ内 HW↓
CMM (Chassis Management Module)
PureFlexラック内 *HW、仮想化基盤
↓FSM (Flex System Manager)
単一コンピュート・ノード HWIMM 2 / FSP
(Integrated Management Module 2)(Flexible Service Processor)
V7000
V7000
V7000
V7000
* 大4シャーシ、年内拡張予定
© 2012 IBM Corporation44
しすなま!第20回
Flex System Manager (FSM)とは
PureFlex Systemの標準管理ソフトウェアで専用のコンピュートノードで動作します。
大4シャーシまで管理可能 (年内管理可能台数は拡張予定).。
コンピュート・ノード、シャーシ、スイッチモジュールの構成から保守にわたる管理タスクを単一のコンソールから実行可能です。
以下の基本機能を提供します。– 構成管理– 監視 &イベント管理– リモート操作– コールホーム
– パッケージ更新– ストレージ装置、ネットワーク装置の一元管理– 異種複数の仮想化&プラットフォーム環境のライフサイクル管理 (仮想サーバーの電源制御・作成・再配置)
さらにAdvanced Featureにより以下の仮想管理機能を提供します– イメージ管理– プロビジョニング (リソース・プール)
専門開発チームによりユーザーエクスペリエンスが強化されており、異種混合・大規模なクラウド環境下でも手早く効率的な管理操作をサポートします。
– Chassis Map– Global Finder
44
© 2012 IBM Corporation45
しすなま!第20回
例)FSMによる電源制御
Resource Explorerで複数のノードを選択
Actionsから選択したノードの電源を一斉ON/OFF
お客様別に管理対象サーバーをグループ
分けできる♪
© 2012 IBM Corporation46
しすなま!第20回
例) FSMによるファームウェア更新
Step 1:インターネットorローカルから
新のファームウェアを導入
Step 2:更新対象のノードを選択し、一括でアップデート
コンプライアンス・ポリシーを設定すれば自動アップデートできる♪
© 2012 IBM Corporation47
しすなま!第20回
例) FSMによるネットワーク機器設定
Configuration TemplateとしてVLAN構成テンプレートを作成
サーバー担当者でもネットワーク設定ができる♪
© 2012 IBM Corporation48
しすなま!第20回
例) FSMによるストレージ構成管理
構成情報/インベントリーを収集・管理
1クリックで各機器の専用コンソールを起動
外部ストレージ装置を把握
複数のストレージも集中管理できる♪
© 2012 IBM Corporation49
しすなま!第20回
例)CMMからリシート(Re-seat)
シャーシからコンピュート・ノードやスイッチへの電力供給をカットするAC Power Off(リシート)をリモートから行な
えます。– Service and Support > Advanced >
• Service Resetタブ > CMM, スイッチ, FSM, コンピュート・ノードからいずれか1つを選択• Reset > Virtual Re-seat
ブレードでは、エラーなどの表示が消えないなど、どうしてもリセットが必要になった場合、シャーシからの抜き差しを現場で実施していた。
サーバー抜き差しするのに現地に行かなくて良い♪
© 2012 IBM Corporation50
しすなま!第20回
CoDとPureSystemsの運用管理比較
Flex System ManagerのNetwork Control機能で
障害監視
IBM Systems DirectorのプラグインであるNetwork Control機能による障害監視
Flex System ManagerのConfiguration Manager機能で設定(PureSystemsではデフォルトで管理用VLANが設定済みのため、すぐにFSMにアクセスできる)
各ネットワーク機器にログインし、CLIによる設定もしくはTFTPサーバーからの設定ファイル流し込み
ネットワーク機器設定
Flex System ManagerのConfiguration Manager機能で設定参照・変更構成テンプレートの活用による一括適用
Advanced Settings Utilityを使って、PowerShellスクリプトから一括設定参照・変更
BIOS/uEFIの設定参照・変更
該当なし
※仮想OSはVMcontrolで管理
IBM Systems Director製品群であるOS Deploying機能を使いOSのベアメタル配布を実施
OSベアメタル配布プロビジョニング
Flex System ManagerのUpdate Manager機能で
シャーシおよびノードのファームウェア更新を一括管理
Server Guide/Bootable Media Creatorでファームウェアイメージを作成し、それらをPXEサーバーか
らネットワーク展開
ファームウェア更新
IBM Systems Director製品群であるOS Deploying機能におけるソフトウェア・パッケージ機能を使いOSと共にソフトウェア配布を実施
ソフトウェア配布
Flex System Managerから一括で電源ON/OFFを実施(IPMIも使用可能。)
IPMIutilをスクリプトで呼び出し、一括で電源ON/OFFを実施
電源制御初期セットアップ
Flex System ManagerのStrage Control機能を使
い、ストレージのリソース利用状況をモニタリング
IBM Systems Director Storage Controlを使い、
ストレージのリソース利用状況をモニタリングストレージ管理
該当なしIBM System Networking Element Managerによりsyslogのイベント集計実施
ネットワーク監視
Flex System ManagerからIMM/CMMをディスカバ
リーしてアウトオブバンド監視を実施
Systems DirectorからIMM/AMMをディスカバリー
してアウトオブバンド監視を実施ハードウェア監視モニタリング
PureSystemsの運用管理CoDでの運用管理作業項目フェーズ
© 2012 IBM Corporation51
しすなま!第20回
PureSystemsによる運用面での変化
インフラ運用管理を自動化するための仕組みが出荷時から組み込まれています。
GUIベースの操作で専門スキルがなくても比較的簡単に運用管理ができます。
これまでのSystems Softwareのスキルセットが活用できます。
IPMIUtilなど
利用ツール
電源制御
必要作業
BoMCFW更新
BoFM構成管理
VMControlイメージ管理
Flex System Manager
該当する操作を組み込みのFSMから実施可能従来は個別に対応操作のためのツールを準備・構成
PureSystemsPureSystemsの利用によりさらなる運用効率向上が期待できますの利用によりさらなる運用効率向上が期待できます
© 2012 IBM Corporation52
しすなま!第20回
第3章:まとめクイズ
Q8.PureFlex System用シャーシーであるIBM Flex System Enterprise シャーシには、14 台のサーバーマウントできる。
Q9.PureFlexは FSM (Flex System Manager) から一元管理
できる。
Q10.Expert Integrated Systems とは「エキスパートが持つ高
度な知見を実装」した新たな製品カテゴリ。
??
??
??
© 2012 IBM Corporation53
しすなま!第20回
© 2012 IBM Corporation54
しすなま!第20回
参考:SNEMによるネットワーク機器のイベント監視
© 2012 IBM Corporation55
しすなま!第20回
Install- Physical- Firmware- Configuration- Advanced PD
Monitoring- Monitoring- Initial PD- Automation
BLADE Harmony ManagerBLADE Harmony ManagerBNT Switch Management BNT Switch Management
Tivoli Network ManagerTivoli Network Manager
Tivoli Tivoli NetcoolNetcoolConfiguration ManagerConfiguration Manager
Netcool/OMNIbusNetcool/OMNIbus
IBM Systems Networking Element Manager (SNEM)によるネットワーク監視集約
SNEMSNEM
SNEMは従来のネットワーク・ソフトウェアが統合されたSystems Softwareです。
© 2012 IBM Corporation56
しすなま!第20回
例)syslogイベント集計
Syslogパーサー(syslog.rules)をカスタマイズすることでイベントごとのSeverityや表示方法を変更可
・Severityごとに色分けして表示・同種のイベントはまとめてCountで表示・その他発生日時、発生したノードなどによってソート可能
イベントの重要度やどういうイベントの発生頻度
が一目で分かる♪
アラートをもっと統計的に把握したい。
© 2012 IBM Corporation57
しすなま!第20回
例)ホスト名の変換
どのノードで発生したイベントかすぐ
に分かる♪
ホスト名やIPアドレスだと直感的に分かりにくい。
192.168.10.10・・・
JMX1SC01A・・・
SNEMのトリガー機能を使い、イベントリストで表示されるノード名を分かりやすい名前に変換
© 2012 IBM Corporation58
しすなま!第20回
例)サーバー再起動によるアラート通知の抑止port downイベントが起きてから5分後にアラート通知
しかし5分以内に同ポートでport upイベントが発生した場合、トリガー機能でアラート通知を取りやめる
再起動のたびに発生するアラート通知を抑止できる♪
サーバー再起動のたびにNWアラート通知を抑
止するのは大変。