障害の再発/未然防止に向けた...

13
障害の再発/未然防止に向けた 原因分析と知識移転 2016年 11月19日 品質環境センタMS推進部 高木 徳生 ◆IPA/SEC 製品・制御システム高信頼化部会委員 ◆IPA/SEC未然防止知識WGメンバ

Transcript of 障害の再発/未然防止に向けた...

Page 1: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

障害の再発/未然防止に向けた 原因分析と知識移転

2016年 11月19日

品質環境センタMS推進部

高木 徳生 ◆IPA/SEC 製品・制御システム高信頼化部会委員 ◆IPA/SEC未然防止知識WGメンバ

Page 2: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 1

本日お話させていただくこと.

1.弊社の品質向上への取組み

・改善活動とその成果 ・障害の再発防止・未然防止活動

2.「原因分析/真因分析」について

・手法 ・取組みのポイント

3.「再発/未然防止に向けた知識移転」について

・手法 ・取組みのポイント

4.おわりに

Page 3: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 2

交通系IC利用・相互利用の拡大で 駅務システム※が大規模化、複雑化する

駅務 システム の変化

安心・安全な駅務システム メーカには、高品質なシステムを 実現できる力を持った技術者集団 であることが期待されている

期待 (ニーズ)

運賃誤収受

システムダウン

1件の不具合が 社会的に大きな影響を

与える!

カード利用情報 処理誤り 『判定処理』から『決済処理』へ.

1.弊社の品質向上への取組み

【鉄道領域における事例】

※駅務システムは、駅の出改札、運賃精算や集計などの業務を実行または支援するために、 自動券売機、自動改札機等出改札機器とそれらに接続される各種サーバで構成される。

Page 4: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved.

0.0

0.2

0.4

0.6

0.8

1.0

1.2

06年度 07年度 08年度 09年度 10年度 11年度 12年度 13年度 14年度

品質の改善スピードが鈍化

【現在注力の取組み】 ・再発/未然防止強化 ・フェーズゲートの強化 ・QA人材育成 ・派生開発手法導入

・現在の注力取組み

状況の変化を契機に組織的なプロセス改善活動に着手。 一定の効果は得られたが、近年改善スピードが鈍化傾向。

時間の経過

3

Page 5: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 4

・障害の再発/未然防止強化

初動対応

根本原因追求

状況把握・エスカレーション

現地対応

客先不具合報告

原因分析

対策案検討

対策実行

対応策の展開

対策の決定

履行確認

知識移転

障害発生

なぜなぜ分析

5W2H

チェックリスト

強化ポイント

分析・対策立案

サポート

履行確認

フォロー

Page 6: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 5

2.原因分析/真因分析の方法

情報収集

システム構造把握

問題構造把握

原因分析

真因 真因 真因 (含誘因)

再発防止

真因 真因 直接原因

真因分析

一般化

教訓DB

【原因分析】 重要インフラシステムでは障害時には復旧を優先しなくてはならない場合も多いと考えられるため、直接原因を特定し、復旧できた後に真因分析の段階で「なぜなぜ分析」を適用することになる。

【真因分析】 再発防止策を具体的アクションに落とし込めるよう真因が的確に抽出されているか、問題事象の原因-結果の因果関係に無理や飛躍はないか、などの観点で分析すべきである。

出典元:「障害未然防止のための教訓化ガイドブック(組込みシステム編)」 (IPA/SEC) <http://www.ipa.go.jp/files/000051617.pdf>

Page 7: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 6

・手法

出典元:「情報処理システム高信頼化教訓集(組込みシステム編)」2015年度版 (IPA/SEC) <http://www.ipa.go.jp/files/000051619.pdf>

Page 8: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 7

・原因分析/真因分析のポイント

問題 対応へのポイント

「現状」の捉え方次第で、分析結果が変わる (違った結果を導く)

・問題事象を正確に表現する 例:「機器Aの処理Bにおいて、本来○○で あるべきが××となっていた」 ・現状把握では「三現主義」に徹する。 問題箇所は現物(コード、文書)で確認し、口 頭報告で「よし」としない。

真因分析において、 「理解不足」等人的要因に帰着すると、それ以上の分析が進まない傾向がある

人的要因が出たときの分析方法を決めておく。 ⇒次ページ参考

Page 9: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved.

正解を 知っていた

誤った理解を していた

正解をしらなかった

なぜ正解を知っていたのに誤ったのか?

(なぜ誤りに気づけなかったのか?)

気づくためのきっかけ(機会)はなかったか?

誤った理解をなぜしたのか?(誤った情報の出所

は?)

人?

モノ?

情報が誤り

情報が曖昧

情報が矛盾

なし? (思い込み)

ヒューマンエラーの分析

(思い込みを誘発する原因) ⇒類似の仕様・処理がある ⇒過去の経験 ⇒直前の経験

組織に知っている人が いたか?

モノがあったか?

当人が知る機会があった (ことを知っていた)?

・説明会 ・トレーニング

なぜ機会を活用しなかったのか

を探る

周知方法の課題 を探る

知識の掘り起し

・例:「理解不足」の深掘り

伝達誤り

理解不足

8

誤って理解

気づくための「機会」の活用

を探る

「機会」の例: ・レビュー ・説明会

あり

なし なし

あり

Page 10: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 9

3.「再発/未然防止に向けた知識移転」について

送り手 受け手

課題

問題意識

課題問題意識

知識 知識事例表出化 内面化

表出化支援

内面化支援

組織ルーチンにおける知識構造(各企業の文脈)

経験 経験構造化

観点・テンプレート分析手法 教育・レビュー

【知識継承モデル】

①技術要素 (機能・処理)

トラブルを 引き起こす メカニズム

対策 問題を引き 起こすトリガー

④発生し得る トラブル内容

②考慮漏れし易い設計視点・観点

③発生契機 対策内容

何が何々したらどうなる (①に②の考慮がもれていると

③が起こったときに④が発生する)

知識を利用者視点で 構成する

出典元:「障害未然防止のための教訓化ガイドブック(組込みシステム編)」 (IPA/SEC) <http://www.ipa.go.jp/files/000051617.pdf> 出典元:(IPA/SEC) 「未然防止知識WG」内部資料

Page 11: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved.

問題 対応へのポイント

再発防止策/未然防止策が増加していく (チェックリストの項目が増えていく)

・陥りやすい失敗がある(繰り返す失敗がある) 重点指向で対応していく。 ・防止策が弥縫策になっていないか? ⇒真因分析を見直す。

再発防止策/未然防止策が定着しない(忘れがちである)

・理屈(左脳)だけでなく、感情(右脳)でも 覚えるようにする(「ヒヤリ」とした感覚と 合わせて記憶) ⇒ストーリー(物語)としての蓄積。 ⇒発想のしやすさにもつながる可能性。

10

・ 「再発/未然防止に向けた知識移転」のポイント

Page 12: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 11

4.おわりに

・変化に対応するためには、様々な「経験知」を組織に組込んで (仕組み化して)活用していく必要がある。 ・組織への組み込みでは、人の特性(不完全、不合理、不安定) を踏まえて仕組み化する。

左図出典元: 「現場で役立つ教訓活用のための実践ガイドブック(組込みシステム編)」(IPA/SEC)<http://www.ipa.go.jp/files/000051616.pdf>

Page 13: 障害の再発/未然防止に向けた 原因分析と知識移転・障害の再発/未然防止強化 初動対応 根本原因追求 状況把握・エスカレーション

© OMRON SOCIAL SOLUTIONS CO., LTD. 2016 All Rights Reserved. 12

4.おわりに

“私たちが何かをできる領域では、失敗の原因は二つだけ。 一つ目が、「無知」 二つ目が、「無能」(正しい知識はあるが、それを正しく活用できない場合のこと) 昔は「無知」が一番の問題であったが、最近は「無能」は「無知」と負けないくらい 重要な問題である” 出典元『あなたはなぜチェックリストを使わないのか』Atul Gawande著、吉田竜訳、晋遊舎 、2011年.

・再発/未然防止の定着には、失敗原因や対策知識の明示知化 とともに活用方法の工夫が重要である。 (知識をためるだけでは活用されない)