山形県 基幹ネットワークが全面停止
日経コンピュータ2008.7.1、動かないコンピュータを読む。
原因は基幹ネットワークの根幹である県庁舎内のルーターからVLAN構成情報が消失してしまったことだった。
村山総合支庁にあるルーターの部品交換時に、必要な設定を怠るという初歩的なミスがデータ消失を招いた。
無効な設定情報が村山総合支庁のルーターから県庁舎内のルーターに同期されてしまい、大規模障害が起きた。
「基幹ネットワーク」ですか。そうですか。
NTT東日本-山形の担当者はドキュメントを見ながら、VLAN構成情報を再登録していった。1件1件は簡単なコマンドを入力する単純作業だが、何しろVLANは800以上もある。すべてが終わるまで5時間以上かかった。
これらはVLAN設定情報のデータをあらかじめ保存しておけば、短時間で済む作業。
基幹ネットワークの運用でこれは・・衝撃的。これって普通なの?障害復旧手順には「手打ちすること」って書いてあったのかな。笑えるんだけど。
お客さんの側も、意識を変えるか、ちゃんと予算つけてベンダーの作業内容がわかる人を雇うとかした方がいいんだろうな。「いやいや、そんないい人材なかなか現場にはこないんだ」とか、そんなこと言ってたら何もかわらないでしょ。