Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights...

26
Copyright RED HAT K.K. All rights reserved. 1 Red Hat Insights システム障害を予防しよう Kazuo Moriwaka <[email protected]> Red Hat K.K. Solution Architect 2017-10-05

Transcript of Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights...

Page 1: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.1

Red Hat Insights でシステム障害を予防しようKazuo Moriwaka <[email protected]>Red Hat K.K. Solution Architect2017-10-05

Page 2: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.2

10 秒で伝える Red Hat InsightsRed Hat Insights はレッドハットの最新の知見 (insights) を元にシステム障害の予兆をプロアクティブに検出して未然に対策を行うための診断サービスです。重大な問題の発生予防に役立ちます。

Page 3: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.3

背景 : 重大なシステム障害のほとんどは既知の問題● 重大なシステム障害のほとんどは、既知の問題が重要

なシステムで発生したもの● 「世界初の問題による重大障害」は多くない● 「よくある問題」を対策・予防することが重要

● もし最新の知見をもとに頻繁に診断し、問題の予兆をプロアクティブに検出して、未然に対策を行うと……→ 重大な障害の発生をかなり減らせる「計画的な保守」によりシステム障害を減らせます

Page 4: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.4

「計画的な保守」をもう少し具体的に考えてみる● 「いつ、誰が、何を行うか」の計画を立案 (Plan)

● システムに影響しそうな既知の問題をリストアップ● それぞれに優先度をつける● 作業内容決め、作業工数を見積り

● 計画に沿って対策を実施 (Do)● 計画どおり実施できているか確認 (Check)● プロセスを改善 (Action)

● 計画に沿ってメンテナンスできない原因を排除● 工数見積りの改善 など

Page 5: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.5

Red Hat Insights とは● レッドハットの SaaS 型システム

分析サービス● サポートの最新の知見を反映

● 情報収集して障害の予兆を検出● 統計情報、ハードウェア情

報、パッケージ、設定、一部ログ等をチェック

● 問題の説明、対策を含むレポートを生成

Page 6: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.6

Red Hat Insights の仕組み● エージェントを各システムに導入し、診断データを送信

● デフォルトで 1 日 1 回定期送信● Red Hat のサーバでデータが解析されます● 問題と対策のレポートを Web ブラウザで閲覧できます

Page 7: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.7

健康診断にたとえてみると……

採血・問診 診断票 対策

エージェントでの情報収集 レポート 具体的な対策手順Ansible Playbook

Page 8: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.8

Planner で作業計画と進捗確認● 検出した問題のうち、対策予定とした

ものを “ Plan” としてまとめる機能● Plan はいくつでも作成可

● Plan に対応する Ansible Playbook を生成

● 一部 Ansible で対応できない問題もあります

● Plan に登録した問題の解決状況をトラッキング

Page 9: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.9

Planner 画面 ( 拡大 ) Ansible Playbook生成

このシステムは対応済みか ?

作業予定の名前予定時刻

検出された問題

対象システム

Page 10: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.10

Executive Report● 過去 1 ヶ月の概要をまとめ

たレポート● 問題検出数の変化● 独自基準のスコア● 問題の多いシステム● 多くのシステムに該当する

問題 など● 最近の変化と全体的な傾向

を簡単に把握

Page 11: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.11

PDCA サイクルにあてはめてみる「運用の改善に役立ちますよ」とだけ言ってもイメージがわきにくいので PDCA にあてはめると……Plan

レポートに重大度、優先度を明記レポートの対策手順から工数推定Plannerで対応時期と項目を整理

Do 具体的な対策手順やAnsible Playbookの提供Check Plannerで対応の進捗を確認

Executive Reportで全体の傾向を確認Action Plannerで計画どおりできなかった部分を把握

Page 12: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.12

まとめ● Red Hat Insights は

レッドハットの最新の知見 (insights) を元にシステム障害の予兆をプロアクティブに検出して未然に対策を行うための診断サービスです。重大な問題の発生予防に役立ちます。

● さっそく試してみましょう● https://access.redhat.com/insights/

Page 13: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.13

次のアクション● 社内勉強会を開催したい● 試しに何台か登録してレポートを見てみたい● もうちょっと詳しい話を聞きたい

担当営業までご相談ください !

Page 14: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.14

THANK YOU!

Page 15: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.15

Appendix

Page 16: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.16

システム運用のアウトソース時にも有用企業 IT 部門 アウトソース先運用管理者

Red Hat Insightsレポート

第三者視点でのチェック課題の共有

問題ごとに重大度づけがあり優先順位を決めやすい

第三者視点でのチェック課題の共有

それぞれの問題に対策が明記されており対応しやすい

Page 17: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.17

インフラ部隊がアプリケーション部隊にシステムを払い出す場合にも有用

インフラ部門 アプリケーション開発・管理Red Hat Insightsレポート

引き渡し前のチェック引き渡し後の継続的なチェックアプリ部門と課題の共有

引き渡し後の継続的なチェックインフラ部門と課題の共有予防保守によりアプリケーションへの影響を最小化

Page 18: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.18

Red Hat Insights の対象製品● Red Hat Insights は以下の製品を対象としています

● Red Hat Enterprise Linux 6.4以降 および 7

● Red Hat Virtualization 4以降● Red Hat OpenStack Platform 7以降● OpenShift Container Platform 3.2以降

Page 19: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.19

Red Hat Insights の価格● Red Hat Insights

● 物理サーバ上の RHEL は 2ソケット毎、仮想マシン上の RHEL は 2ゲスト毎25,900円 /年

● Red Hat Insights, Unlimited Guests● ハイパーバイザとして利用される物理サーバの

2ソケット毎、仮想マシン数の制限なし97,400円 /年

Page 20: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.20

Red Hat Insights の制限● 網羅性

● セキュリティ上の問題を網羅的に表示するものではありません。重大な問題だけを表示します。

● ネットワーク接続● カスタマーポータルとの通信が必須です● Red Hat Satellite または一般的な HTTP プロキシサー

バ経由で接続できれば利用可能です

Page 21: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.21

Appendixレポートで報告される問題の例

Page 22: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.22

例 1: 既知の脆弱性を検出linux kernel の脆弱性を検出

Page 23: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.23

例 2: 設定内容の問題検出 脆弱な暗号化方式を許可している設定を検出

Page 24: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.24

例 3: 設定と実態の比較による問題検出 設定意図に反して THP が有効であることを検出

Page 25: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.25

例 4: 統計情報による問題検出 NIC での CRC エラー頻発を検出

Page 26: Red Hat Insights で システム障害を予防しよう...3 Copyright RED HAT K.K. All rights reserved. 背景: 重大なシステム障害のほとんどは既知の問題 重大なシステム障害のほとんどは

Copyright RED HAT K.K. All rights reserved.26

例 5: 他社製品ナレッジ、サービス状態による検出 競合する Oracle RAC と Avahi の併存を検出