この記事をtweetする このエントリーをはてなブックマークに追加

IT現場の道先案内人 Key Conductors

運用現場の課題と解決 第二回

運用管理 2012/12/21

現場担当者はミスを無くしたい

第一回で挙げた3つの立場ごとに課題と解決について解説していく。まずは直接システム運用作業を行う現場担当だが、現場担当の作業は高度化しており、負荷や責任が高まっている。オペレーターという言葉からオペレーションエンジニアや運用SEなどのように呼称が変化しているケースもある。属人的な運用は良くないと言われ続けているが、「運用でカバーする」 という言葉が無くならないように、現場担当の負担は軽くなっていない。オペレーションミスによる重大障害も度々ニュースになり、現場担当としては気の抜けない作業を毎日強いられている。一昔前の職人技の世界に比べるとかなり自動化も進んでいるものの、人の関与が必要な中途半端な自動化がかえって被害を大きくする場合もある。

トラブルの7割は「人」起因で発生している

障害原因の約7割は「人」起因で発生しているとのデータがある。逆に言うとハードウェア障害やミドルウェアのバグなどの不可抗力による障害は3割しかなく、それ以外は何かしらの対策が可能とも言える。ここでいう「オペレーションミス」は、オペレータの操作ミスである。これを防ぐにはスキル向上などの対策が考えられるが、人間が行うことなのでミスはゼロにならないことを前提にすべきである。「運用ミス」は、運用担当者の手順指示ミスや申請ミスである。運用プロセスを適切に整備して現場に定着させるだけでなく、常に改善を繰り返すことが必要である。「考慮漏れ」は、基盤設計時の検討不足などである。運用を考慮した開発設計、および綿密な運用設計が求められる。

※会員登録いただくと図をご覧いただけます。
会員登録はこちら(無料)

人材育成、トレーニング

ミスを無くすには、まずはスキルの向上である。個々人のスキルを上げるのも重要であるが、運用チーム全体の平均スキルを如何に上げるかがポイントになる。オペレーションミスは技術的スキルの不足だけでなく、基本スキルであるヒューマンスキルやビジネススキルも起因してくる。たとえば、「相手の話を復唱する」、「まずは手順書を確認する」などの基本的な動作は業務経験を重ねるに従い疎かになりがちなので、定期的に確認する必要がある。

解決施策としては、基本スキルについては工事現場などで活用されているKY(危険予知)訓練の考え方が有効である。現状把握、本質追求、対策樹立、目標設定の訓練を行うことにより、危険察知能力が向上し、不慮の現象にも対応できるスキルを身につけられる。技術的スキル向上にはシミュレーションが有効である。お作法が異なるシステムの運用作業に入る前にツールによって疑似体験をするのである。さらに、いざ障害が発生した場合にあわてないために、異常事態を事前に疑似体験することも可能である。集合研修やe-learningなどよりも有効という調査結果もある。

ヒヤリ・ハットを如何に活かすか

※会員登録いただくと図をご覧いただけます。
会員登録はこちら(無料)

技術的スキルや基本スキルを向上させてもミスは無くならない。しかし、小さなミスの段階で対策を行うことにより、大きな障害を事前に防ぐことは可能である。ハインリッヒの法則では1件の重大障害の裏には300件のヒヤリ・ハットがあると言っている。日々の運用業務においてヒヤリ・ハットや新たな気付きは多々あるが、個々人の中で留まっており、チームとして活かすことができていない。たとえば「DBMSの・・・バージョンのパッチ適用時は、、、に気をつけた方が良い」などの気づきである。それらの情報はたとえ些細なことでもチーム内で共有することにより、チーム全体のミスを未然に防ぐことができる。また、ヒヤリ・ハットを共有するというマインドを持つことにより、作業に対しより注意深くなり同じミスを起こさなくなる。

具体的対策としては、まずはインシデント管理ツールなどに何でも書き込める箱を用意することが挙げられる。細かなデータを貯めることからスタートし、それらを検索可能にする。さらに、データの整理や分析を行い、ナレッジとして昇華させられればミス防止に効果がでてくる。しかし、これらの仕組みをつくるだけでは情報は貯まらない。小さなミスを責めるのではなく、犯したミスを報告・共有することに対し称賛する文化定着がポイントとなる。

※会員登録いただくと図をご覧いただけます。
会員登録はこちら(無料)

コミュニケーションを効率化

障害起因分析で一番多いのが「運用ミス」だったが、運用ミスの要因として挙げられるのが関係者間のコミュニケーションミスである。メールでの連絡では伝わりにくく、電話での連絡では詳細を忘れやすい。特に、直接当事者から発せられる一次情報と間接的に入手する二次情報では精度に大きな差があり、誤認識の原因になる。一次情報を整理して箇条書きでエスカレーションする場合が多いが、実はユーザ側の状況説明など細かなところに重要な情報が隠れている場合がある。逆に一次情報ばかりでは情報が氾濫してしまい、対応モレや作業効率の低下につながる。解決策としては、運用チームに来る情報を全て一元管理し、その中で受け付け、エスカレーション、承認、回答、等のプロセスを廻すことが有効である。だれがいつ、何を行うべきかが管理でき、過去の経緯も瞬時に把握できるため、状況把握が適切になり運用ミス防止につながる。

※会員登録いただくと図をご覧いただけます。
会員登録はこちら(無料)

次回は今回触れなかった考慮漏れも含め、チームリーダにおける課題と解決について解説する。

会員限定で「読者からのコメント」が読み書きできます! 「読者からのコメント」は会員限定の機能。会員登録を行い、ログインすると読者からのコメントが読み書きできるようになります。

会員登録(無料)・ログイン

Myリストへ 印刷用ページへ

この記事をtweetする このエントリーをはてなブックマークに追加


この寄稿記事に掲載している情報は、掲載日時点での情報となります。内容は変更となる場合がございますのでご了承下さい。また、「Key Conductors」の寄稿記事及び当該記事に寄せられたコメントについては、執筆者及びコメント投稿者の責任のもと掲載されているものであり、当社が、内容の最新性、真実性、合法性、安全性、適切性、有用性等を保証するものではありません。


30005390


IT・IT製品TOP > Key Conductors > 寺井 忠仁(株式会社野村総合研究所) > 運用現場の課題と解決 第二回

このページの先頭へ

キーマンズネットとは
インソースシステムにおける運用改善が専門。2006年より統合運用管理ツールSenju Familyの企画を担当。システム運用現場が嬉しいことを追求し、現場の視点に徹したツール提供やプロセス改善、人材育成支援を行っている。 ITIL Expert(V3)

ページトップへ