Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 ·...

36
Copyright © 2016 TIS Inc. All rights reserved. Zabbixパートナー会 技術分科会 Zabbix3.2 新機能検証結果報告 IT基盤技術推進部 OSS推進室 池⽥ ⼤輔

Transcript of Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 ·...

Page 1: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved.

Zabbixパートナー会 技術分科会

 Zabbix3.2 新機能検証結果報告

IT基盤技術推進部OSS推進室池⽥ ⼤輔

Page 2: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 2

アジェンダ

❏  Zabbixパートナー会 技術分科会の取り組み❏  Zabbix3.2ワークショップについて❏  Zabbix3.2の主な新機能紹介❏  3.0→3.2へのアップデート❏ まとめ

Page 3: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 3

⾃⼰紹介

池⽥ ⼤輔 (いけだ だいすけ)

TIS株式会社OSS推進室 マーケティング担当

興味ポイント【インフラ基盤管理・運⽤管理効率化】Zabbix、JobScheduler、Ansible、Serverspec、Docker、AWS、fluentd、Elasticsearch、Golang 等々

Page 4: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 4

Zabbixパートナー会 技術分科会の取り組み

Page 5: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 5

Zabbixパートナー会 技術分科会とは?

Zabbixパートナー会

技術分科会

・Zabbix社とそのパートナー企業(約40社)で構成する会・3ヶ⽉に⼀度の情報共有会等実施・各種イベント出展・イベント開催等

・特に技術⾯に特化した活動を⾏う分科会

・主に各パートナー企業のサポート品質向上を⽬的とした活動

・活動テーマ毎に参加企業・参加メンバー募集し、活動実施

Zabbix社パートナー⼀覧: http://www.zabbix.com/jp/partners

Page 6: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 6

Zabbixパートナー会 技術分科会 活動実績

Zabbix2.4機能検証

Interop ShowNet

出展

Zabbix3.0機能検証

Zabbix3.2機能検証

Interop ShowNet

出展

・・・

・・・

新バージョンの先⾏検証

ShowNet⼤規模環境監視でのチャレンジ

Page 7: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 7

Zabbix3.2 ワークショップについて

Page 8: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 8

Zabbix3.2ワークショップ 概要

実施⽬的・実施内容

参加企業

・Zabbix 3.2正式リリース時に即座にサポート開始できるように・Zabbix 3.2リリース前に検証実施することで不具合等を事前に撲滅できるように・参加企業間で担当機能を分担して検証実施、参加企業間で情報共有

インフォコム株式会社様 NTTコム ソリューションズ株式会社様 Zero Networks株式会社様 TIS株式会社

Page 9: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 9

Zabbix3.2ワークショップ 実施スケジュール

Zabbix3.2正式リリース

参加企業募集開始

検証結果報告会開催

α版を使った検証実施

検証結果をZabbix開発元にFB約3週間

Page 10: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 10

Zabbix3.2の主な新機能紹介

Page 11: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

2016.9.14リリース

よりナチュラルに!より⼤規模での運⽤も意識して!

Page 12: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 12

トリガーの障害発⽣条件の指定と復旧条件の指定の分離

イベントの相関関係設定

ホストグループの階層構造設定

よりナチュラルに!

より「⼈が頭で考えていること」を表現できるように

Page 13: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 13

より⼤規模での運⽤も意識して!

ログのバースト発⽣への対処

関連イベントへのコメント追加⼀括処理

「より⼤量のデータ」、「多くのイベント」を効率良く管理できるように

Page 14: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 14

復旧条件の指定 -これまでの障害判定-

これまで(3.0まで)のZabbixでの障害判定の⽅法

障害が発⽣したとみなすのは条件を満たす時である

復旧したとみなすのは条件を満たさなくなった時である

例)  ディスクの使⽤率が80%以上である → 障害  ディスクの使⽤率が80%以上ではなくなった → 復旧

Page 15: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 15

3.2新機能

1つのトリガー設定に対して、

障害の条件式と

復旧条件式が指定可能に

※これまで通り、条件式1つでの運⽤も可

復旧条件の指定 -新機能仕様-

Page 16: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 16

復旧条件の指定 -メリット-

80%

50%

ディスク使⽤率80%を超えたら対策を打つ対策が完了してディスク使⽤率50%を下回れば復旧

条件式

〜3.0

【条件式】

 ディスク使⽤率 >= 80【復旧条件式】

 ディスク使⽤率 < 50

【条件式】(現在のトリガーのステータス=障害ではない        and ディスク使⽤率 >= 80)or(現在のトリガーのステータス=障害       and ディスク使⽤率 < 50)

3.2

Page 17: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 17

イベントの相関関係 -これまでのイベント管理-

あるログにErrorという⽂字列が発⽣すれば障害

含まれていなければ復旧障 害

障 害

Error process-1

Error process-2

Error process-1 障 害

あるトリガー条件式

Page 18: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 18

あるログにErrorという⽂字列が発⽣すれば障害

含まれていなければ復旧

イベントの相関関係 -これまでのイベント管理-

復 旧

Error process-1

Error process-2

Error process-1

OK process-1

あるトリガー条件式

復旧イベントが発⽣すればトリガーに紐づく障害イベントすべてが解決済みに

障 害

障 害

障 害

解決済み

解決済み

解決済み

本当はOKになったのはprocess-1だけなのに。。。

Page 19: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 19

イベントの相関関係 -新機能仕様-

①イベントにタグ付けが可能に

Error process-1

Error process-2

Error process-1

OK process-1

Process: 1 State: Error

Process: 2 State: Error

Process: 1 State: Error

Process: 1 State: OK

「Key: Value」型Valueには監視結果から抽出した値も設定可能

例){{ITEM.VALUE}.regsub(“(^\S+)”, “\1”)}

→ErrorやOKをValueに設定

Page 20: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 20

イベントの相関関係 -新機能仕様-

①イベントにタグ付けが可能に

②タグの内容を条件指定して障害イベントをクローズ可能に

Page 21: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 21

rsyslog stop

httpd start

イベントの相関関係 -メリット-

ログ監視等⼀連の監視結果の流れの中で結果を関連付けて管理可能に

mysqld stop

httpd stop

mysqld start

rsyslog start

Page 22: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 22

ホストグループ階層化 -これまでのホストグループ管理-

これまで(3.0まで)のZabbixではホストグループはフラット

東京DC-1

⼤阪DC-1

ラックNo-110

Web Servers

ホストグループ

ラックNo-210

DB Servers

ホスト

server-01

server-02

Page 23: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 23

ホストグループ階層化 -新機能仕様-

「/」区切りで階層的に表現が可能に

[監視データ]→[最新データ]確認ページや[監視データ]→[障害]確認ページにて階層構造化されたグループでのフィルタリングが可能に例) 東京DC-1のホストすべてを表⽰したければ「東京DC-1/*」

Page 24: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 24

ホストグループ階層化 -メリット-

現実のシステムでは階層構造を取るものが多い

DataCenterHyperVisor

VirtualMachineLinux

Web

Zabbixのホスト管理でも同じ感覚で管理  ⾒たい情報へのアクセスを素早く

現⾏の機能では・「東京DC-1/*/Web Servers」といった指定ができない・フィルタリングに使える画⾯が限定的などできることには限りあり

Page 25: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 25

1度に監視できる最⼤⾏数「MaxLinesPerSecond(最⼤1000)」で指定した⾏数のみ秒間送付

Zabbix Server Zabbix Agent

2016-11-18 10:00:00 [Error]...2016-11-18 10:00:00 [Error]...2016-11-18 10:00:00 [Error]...

… …

… 2016-11-18 10:00:00 [Error]...

受信し、監視結果として登録

ログが⼤量発⽣→いつまでたっても最新のログの監視ができず。。

ログのバースト発⽣対応 -これまでのログ監視-

Page 26: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 26

ログのバースト発⽣対応 -新機能仕様-

ログ監視アイテムのパラメータに「maxdelay」が追加

未チェックのログのデータサイズを確認

log[file,<regexp>,<encoding>,<maxlines>,<mode>,<output>,<maxdelay>]

maxdelayで指定した秒数の間に処理ができる?

通常の処理処理できる箇所までログ読み取りを⾶ばす

Yes No

Zabbix Agent処理ロジック

Page 27: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 27

ログのバースト発⽣対応 -メリット-

バースト発⽣時の不要なログを切り捨てて

     素早く最新の状況を知ることが可能に

読み⾶ばしたことを検知する仕組みは必要→読み⾶ばしたことはZabbixAgentのログに情報が出⼒

14287:20160602:174344.206item:"logrt["/home/zabbix32/test[0-9].log",ERROR,,1000,,,120.0]"logfile:"/home/zabbix32/test1.log"skipping679858bytes(frombyte75653115tobyte76332973)tomeetmaxdelay

Page 28: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 28

ログのバースト発⽣対応 -ログ発⽣件数監視-

特定のログの発⽣件数のみを監視したい場合

log.count logrt.count 監視アイテムが新規追加※監視間隔単位時間当たりのログ発⽣件数を監視

⼤量のログ発⽣時でも最低限必要な発⽣件数のみの監視が可能ログの⽂字列⾃体をDBに保存することもないのでデータにも優しい

Page 29: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 29

復 旧

関連イベントへの⼀括処理 -これまでの障害対応コメント-

あるトリガー条件式

障 害

障 害

障 害

障 害

対応済みコメント

対応済みコメント

対応済みコメント

対応済みコメント

各障害イベントに個別に対応済みコメントを付与

Page 30: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 30

関連イベントへの⼀括処理 -新機能仕様-

Page 31: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 31

関連イベントへの⼀括処理 -メリット-

同様の事象を起因とした障害イベントへの

対応を⼀括化  ⼤量イベント発⽣時の管理効率化復 旧

あるトリガー条件式

障 害

障 害

障 害

障 害 対応済みコメント

Page 32: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 32

Zabbix3.0 → 3.2 アップデート

Page 33: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 33

アップデート⽅法

依存するパッケージ類のバージョン変更は特になし(PHP5.4以上等3.0と同様)設定ファイル(zabbix_server.conf/zabbix_agentd.conf等)の記載内容の変更もなし  Zabbix Server等のバイナリを⼊れ替えて再起動するだけ

監視の履歴データ(history_log,history_text)を⼤量に保持している環境のアップデートの場合データ更新に時間がかかる恐れあり

Page 34: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 34

まとめ

Page 35: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

Copyright © 2016 TIS Inc. All rights reserved. 35

これ以外にも多くのアップデートが

紹介したのはごく⼀部Zabbixパートナー会技術分科会では新機能を網羅的に検証し、確実なサポートを提供すべく取り組みを実施しています。

 「最新情報が気になる」 「最新版を使った構築を希望する」 「バージョンアップについ確認したい」などぜひご相談を

インフォコム株式会社様 NTTコム ソリューションズ株式会社様 Zero Networks株式会社様 TIS株式会社

Page 36: Zabbixパートナー会 技術分科会 3.2 新機能検証結果報告 · Zabbix、JobScheduler、Ansible、Serverspec、 ... 2016.9.14リリース ... アップデートの場合データ更新に時間がかかる恐れあり

THANK YOU