Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 ·...
Transcript of Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 ·...
Copyright © 2016 TIS Inc. All rights reserved.
Zabbixパートナー会 技術分科会
Zabbix3.2 新機能検証結果報告
IT基盤技術推進部OSS推進室池⽥ ⼤輔
Copyright © 2016 TIS Inc. All rights reserved. 2
アジェンダ
❏ Zabbixパートナー会 技術分科会の取り組み❏ Zabbix3.2ワークショップについて❏ Zabbix3.2の主な新機能紹介❏ 3.0→3.2へのアップデート❏ まとめ
Copyright © 2016 TIS Inc. All rights reserved. 3
⾃⼰紹介
池⽥ ⼤輔 (いけだ だいすけ)
TIS株式会社OSS推進室 マーケティング担当
興味ポイント【インフラ基盤管理・運⽤管理効率化】Zabbix、JobScheduler、Ansible、Serverspec、Docker、AWS、fluentd、Elasticsearch、Golang 等々
Copyright © 2016 TIS Inc. All rights reserved. 4
Zabbixパートナー会 技術分科会の取り組み
Copyright © 2016 TIS Inc. All rights reserved. 5
Zabbixパートナー会 技術分科会とは?
Zabbixパートナー会
技術分科会
・Zabbix社とそのパートナー企業(約40社)で構成する会・3ヶ⽉に⼀度の情報共有会等実施・各種イベント出展・イベント開催等
・特に技術⾯に特化した活動を⾏う分科会
・主に各パートナー企業のサポート品質向上を⽬的とした活動
・活動テーマ毎に参加企業・参加メンバー募集し、活動実施
Zabbix社パートナー⼀覧: http://www.zabbix.com/jp/partners
Copyright © 2016 TIS Inc. All rights reserved. 6
Zabbixパートナー会 技術分科会 活動実績
Zabbix2.4機能検証
Interop ShowNet
出展
Zabbix3.0機能検証
Zabbix3.2機能検証
Interop ShowNet
出展
・・・
・・・
新バージョンの先⾏検証
ShowNet⼤規模環境監視でのチャレンジ
Copyright © 2016 TIS Inc. All rights reserved. 7
Zabbix3.2 ワークショップについて
Copyright © 2016 TIS Inc. All rights reserved. 8
Zabbix3.2ワークショップ 概要
実施⽬的・実施内容
参加企業
・Zabbix 3.2正式リリース時に即座にサポート開始できるように・Zabbix 3.2リリース前に検証実施することで不具合等を事前に撲滅できるように・参加企業間で担当機能を分担して検証実施、参加企業間で情報共有
インフォコム株式会社様 NTTコム ソリューションズ株式会社様 Zero Networks株式会社様 TIS株式会社
Copyright © 2016 TIS Inc. All rights reserved. 9
Zabbix3.2ワークショップ 実施スケジュール
Zabbix3.2正式リリース
参加企業募集開始
検証結果報告会開催
α版を使った検証実施
検証結果をZabbix開発元にFB約3週間
Copyright © 2016 TIS Inc. All rights reserved. 10
Zabbix3.2の主な新機能紹介
2016.9.14リリース
よりナチュラルに!より⼤規模での運⽤も意識して!
Copyright © 2016 TIS Inc. All rights reserved. 12
トリガーの障害発⽣条件の指定と復旧条件の指定の分離
イベントの相関関係設定
ホストグループの階層構造設定
よりナチュラルに!
より「⼈が頭で考えていること」を表現できるように
Copyright © 2016 TIS Inc. All rights reserved. 13
より⼤規模での運⽤も意識して!
ログのバースト発⽣への対処
関連イベントへのコメント追加⼀括処理
「より⼤量のデータ」、「多くのイベント」を効率良く管理できるように
Copyright © 2016 TIS Inc. All rights reserved. 14
復旧条件の指定 -これまでの障害判定-
これまで(3.0まで)のZabbixでの障害判定の⽅法
障害が発⽣したとみなすのは条件を満たす時である
復旧したとみなすのは条件を満たさなくなった時である
例) ディスクの使⽤率が80%以上である → 障害 ディスクの使⽤率が80%以上ではなくなった → 復旧
Copyright © 2016 TIS Inc. All rights reserved. 15
3.2新機能
1つのトリガー設定に対して、
障害の条件式と
復旧条件式が指定可能に
※これまで通り、条件式1つでの運⽤も可
復旧条件の指定 -新機能仕様-
Copyright © 2016 TIS Inc. All rights reserved. 16
復旧条件の指定 -メリット-
80%
50%
ディスク使⽤率80%を超えたら対策を打つ対策が完了してディスク使⽤率50%を下回れば復旧
条件式
〜3.0
【条件式】
ディスク使⽤率 >= 80【復旧条件式】
ディスク使⽤率 < 50
【条件式】(現在のトリガーのステータス=障害ではない and ディスク使⽤率 >= 80)or(現在のトリガーのステータス=障害 and ディスク使⽤率 < 50)
3.2
Copyright © 2016 TIS Inc. All rights reserved. 17
イベントの相関関係 -これまでのイベント管理-
あるログにErrorという⽂字列が発⽣すれば障害
含まれていなければ復旧障 害
障 害
Error process-1
Error process-2
Error process-1 障 害
あるトリガー条件式
Copyright © 2016 TIS Inc. All rights reserved. 18
あるログにErrorという⽂字列が発⽣すれば障害
含まれていなければ復旧
イベントの相関関係 -これまでのイベント管理-
復 旧
Error process-1
Error process-2
Error process-1
OK process-1
あるトリガー条件式
復旧イベントが発⽣すればトリガーに紐づく障害イベントすべてが解決済みに
障 害
障 害
障 害
解決済み
解決済み
解決済み
本当はOKになったのはprocess-1だけなのに。。。
Copyright © 2016 TIS Inc. All rights reserved. 19
イベントの相関関係 -新機能仕様-
①イベントにタグ付けが可能に
Error process-1
Error process-2
Error process-1
OK process-1
Process: 1 State: Error
Process: 2 State: Error
Process: 1 State: Error
Process: 1 State: OK
「Key: Value」型Valueには監視結果から抽出した値も設定可能
例){{ITEM.VALUE}.regsub(“(^\S+)”, “\1”)}
→ErrorやOKをValueに設定
Copyright © 2016 TIS Inc. All rights reserved. 20
イベントの相関関係 -新機能仕様-
①イベントにタグ付けが可能に
②タグの内容を条件指定して障害イベントをクローズ可能に
Copyright © 2016 TIS Inc. All rights reserved. 21
rsyslog stop
httpd start
イベントの相関関係 -メリット-
ログ監視等⼀連の監視結果の流れの中で結果を関連付けて管理可能に
mysqld stop
httpd stop
mysqld start
rsyslog start
Copyright © 2016 TIS Inc. All rights reserved. 22
ホストグループ階層化 -これまでのホストグループ管理-
これまで(3.0まで)のZabbixではホストグループはフラット
東京DC-1
⼤阪DC-1
ラックNo-110
Web Servers
ホストグループ
ラックNo-210
DB Servers
ホスト
server-01
server-02
Copyright © 2016 TIS Inc. All rights reserved. 23
ホストグループ階層化 -新機能仕様-
「/」区切りで階層的に表現が可能に
[監視データ]→[最新データ]確認ページや[監視データ]→[障害]確認ページにて階層構造化されたグループでのフィルタリングが可能に例) 東京DC-1のホストすべてを表⽰したければ「東京DC-1/*」
Copyright © 2016 TIS Inc. All rights reserved. 24
ホストグループ階層化 -メリット-
現実のシステムでは階層構造を取るものが多い
DataCenterHyperVisor
VirtualMachineLinux
Web
Zabbixのホスト管理でも同じ感覚で管理 ⾒たい情報へのアクセスを素早く
現⾏の機能では・「東京DC-1/*/Web Servers」といった指定ができない・フィルタリングに使える画⾯が限定的などできることには限りあり
Copyright © 2016 TIS Inc. All rights reserved. 25
1度に監視できる最⼤⾏数「MaxLinesPerSecond(最⼤1000)」で指定した⾏数のみ秒間送付
Zabbix Server Zabbix Agent
2016-11-18 10:00:00 [Error]...2016-11-18 10:00:00 [Error]...2016-11-18 10:00:00 [Error]...
… …
… 2016-11-18 10:00:00 [Error]...
受信し、監視結果として登録
ログが⼤量発⽣→いつまでたっても最新のログの監視ができず。。
ログのバースト発⽣対応 -これまでのログ監視-
Copyright © 2016 TIS Inc. All rights reserved. 26
ログのバースト発⽣対応 -新機能仕様-
ログ監視アイテムのパラメータに「maxdelay」が追加
未チェックのログのデータサイズを確認
log[file,<regexp>,<encoding>,<maxlines>,<mode>,<output>,<maxdelay>]
maxdelayで指定した秒数の間に処理ができる?
通常の処理処理できる箇所までログ読み取りを⾶ばす
Yes No
Zabbix Agent処理ロジック
Copyright © 2016 TIS Inc. All rights reserved. 27
ログのバースト発⽣対応 -メリット-
バースト発⽣時の不要なログを切り捨てて
素早く最新の状況を知ることが可能に
読み⾶ばしたことを検知する仕組みは必要→読み⾶ばしたことはZabbixAgentのログに情報が出⼒
14287:20160602:174344.206item:"logrt["/home/zabbix32/test[0-9].log",ERROR,,1000,,,120.0]"logfile:"/home/zabbix32/test1.log"skipping679858bytes(frombyte75653115tobyte76332973)tomeetmaxdelay
Copyright © 2016 TIS Inc. All rights reserved. 28
ログのバースト発⽣対応 -ログ発⽣件数監視-
特定のログの発⽣件数のみを監視したい場合
log.count logrt.count 監視アイテムが新規追加※監視間隔単位時間当たりのログ発⽣件数を監視
⼤量のログ発⽣時でも最低限必要な発⽣件数のみの監視が可能ログの⽂字列⾃体をDBに保存することもないのでデータにも優しい
Copyright © 2016 TIS Inc. All rights reserved. 29
復 旧
関連イベントへの⼀括処理 -これまでの障害対応コメント-
あるトリガー条件式
障 害
障 害
障 害
障 害
対応済みコメント
対応済みコメント
対応済みコメント
対応済みコメント
各障害イベントに個別に対応済みコメントを付与
Copyright © 2016 TIS Inc. All rights reserved. 30
関連イベントへの⼀括処理 -新機能仕様-
Copyright © 2016 TIS Inc. All rights reserved. 31
関連イベントへの⼀括処理 -メリット-
同様の事象を起因とした障害イベントへの
対応を⼀括化 ⼤量イベント発⽣時の管理効率化復 旧
あるトリガー条件式
障 害
障 害
障 害
障 害 対応済みコメント
Copyright © 2016 TIS Inc. All rights reserved. 32
Zabbix3.0 → 3.2 アップデート
Copyright © 2016 TIS Inc. All rights reserved. 33
アップデート⽅法
依存するパッケージ類のバージョン変更は特になし(PHP5.4以上等3.0と同様)設定ファイル(zabbix_server.conf/zabbix_agentd.conf等)の記載内容の変更もなし Zabbix Server等のバイナリを⼊れ替えて再起動するだけ
監視の履歴データ(history_log,history_text)を⼤量に保持している環境のアップデートの場合データ更新に時間がかかる恐れあり
Copyright © 2016 TIS Inc. All rights reserved. 34
まとめ
Copyright © 2016 TIS Inc. All rights reserved. 35
これ以外にも多くのアップデートが
紹介したのはごく⼀部Zabbixパートナー会技術分科会では新機能を網羅的に検証し、確実なサポートを提供すべく取り組みを実施しています。
「最新情報が気になる」 「最新版を使った構築を希望する」 「バージョンアップについ確認したい」などぜひご相談を
インフォコム株式会社様 NTTコム ソリューションズ株式会社様 Zero Networks株式会社様 TIS株式会社
THANK YOU