読者です 読者をやめる 読者になる 読者になる

山下寛人オフィシャルブログ

オイシックス株式会社 執行役員 システム本部長 山下寛人の公式ブログです。

トラブルの再発防止はやりすぎぐらいがちょうどよい

システム運用にトラブルはつきものです。トラブルが起こるのはある程度仕方のないことです。ゼロを目指すべきですがゼロにはならないものです。

起こった後のほうがむしろ大事です。2度と同じトラブルを起こさない。そのために原因を調べ、再発防止を行います。

ところがこの再発防止はなかなか簡単ではありません。プログラムを改修しても例外ケースがあったりします。毎日人手でチェックすることにしても祝日があってチェックされず運悪くそんなときに限ってトラブルになったりします。時が経っていつのまにかチェックが甘くなったりチェックがされなくなったりします。

このような事態を避けるためのポイントの1つには、やりすぎなくらいやるということが1つあります。これくらいやっておけばまあ大丈夫でしょう、と思ったり、再発防止必要だけどここまでやるのはさすがに面倒とか、コストがもったいない、などと思ったときはだいたい同じ失敗を繰り返します。絶対に二度と同じトラブルを起こさないという強い意志を持って徹底的に仕組みづくりをし、徹底的に実行する。今までの経験からはそれくらいがちょうどいいと思います。