ISACA 2009年8月例会



久方振りに、月例会に出席。本日のお題は、「『失敗に学ぶ』−失敗の根本原因から再発防止を考える」。


大枠の趣旨としては、「罪を憎んで人を憎まず」というか、失敗した当事者を一方的に攻め立てるのではなく、なぜその失敗が発生したのか、本質的な原因を追究することに注力すべき、という内容。そして、本質的な原因の追究には、トヨタで有名な5Why手法を活用する。


正直、講演の内容は、資料をざっと読んだだけであんま聞いてなかったのだが、例会中、システム運用において、失敗を未然に防ぐために必要なことって何だろうと、ぼんやり考えていた。ここで言う「失敗」とは、障害を未然に防げるチャンスはあったのにも関わらず、結局防ぐことができなかった、という事態を想定。運用中、「あ、これなんかヤバそう」という瞬間があって、それは、ちょっとした設定漏れやテスト漏れの発見、ログに出力された怪しげなメッセージの発見、本番環境におけるなんらかの怪しげな挙動に対する気づき、等であったりする。振り返ってみると、「ああ・・・あの時対応していれば・・・」といったことが、運用において色々とあった気がする。ヤバそうな兆候に気づいたにも関わらず、それが表に出ない原因として、「気づいた人が、対応しないといけない。だから、あんまり言いたくない」というのがある気がする。プロとしてどうなのという話はもちろんあるのだが、新規開発と運用を掛け持ちするようなひどい体制でやっていると、ついつい魔が差してしまうことがある。人間だもの。だから、リーダーは、「障害の兆候を見つけた人と、それに対応する人は分けます」と宣言して、実際にそういう体制を組むのも一つの手だよなと思った。障害の兆候に気づく人っていうのは、往々にして技術があって、意識も高い人が多い気がするのだが、兆候に気づく→対応→また別の兆候に気づく→また対応→またまた(略)が続くと、その人は疲弊するばっかりだよね。こういう不幸な事態を防ぐために、体制的な仕組みが必要じゃないかと思ったりした。


全然まとまらんかったが、概ねそんなことをつらつらと考えていた。そんな水曜日。