メディア

情シスが「勤務時間の30%」を奪われている業務って何?【調査】CIO Dive

ある調査によると、平均して30%の時間を「ある業務」に費やしていることが分かった。そればかりか、その業務の原因となる事象からは「1時間当たり最大で約285億円」という莫大な損失も生じているという。

» 2024年12月02日 07時00分 公開
[Matt AshareCIO Dive]

 情報システム部門は、従来業務に加えて、IT戦略の立案やAIといった新技術の導入など、さまざまな役割を期待されるようになっている。年々負担が重くなる一方の情報システム部門の勤務時間の30%が「ある業務」に費やされていることが、ある調査で発覚した。

 そればかりか、その業務が発生する原因となる事象からは「1時間当たり最大で約285億円」という膨大な損失まで生じているという。それは何か。

「勤務時間の30%」「1時間で最大285億円」を奪うものとは?

 システム監視サービスを提供するNew Relicが2024年10月22日(現地時間、以下同)に発表した報告書によると(注1)、影響度の高いシステム障害で発生したダウンタイムの中央値は年間77時間で、1時間当たりの損失額は最大190万ドルに上るという。同社はERTに調査を委託し、2024年4月と同年5月に1700人の技術者を対象に調査を実施した。

 同調査によると、回答者は「ITチームは平均して30%の時間を障害対応に費やしている」と述べている。これは週40時間の勤務時間のうちの12時間に相当する。過去2年間に報告された計画外の障害の主な原因は、ネットワーク障害やサードパーティサービスの問題、人的ミスだった。

 New Relicのニック・ベンダーズ氏(チーフテクニカルストラテジスト)によると、2024年7月にCrowdStrikeが発生させた、「Windowsシステム」の更新に関連する不具合によって発生したような大規模障害は業務を停止させる可能性がある(注2)。しかし、小規模障害でも影響が雪だるま式に拡大する場合がある。同氏は、「CrowdStrikeでなくても、大きな問題につながる可能性がある。比較的小さな技術の問題によりITの業務機能が停止する場合があるのだ」と「CIO Dive」に述べた。

CrowdStrikeによる障害から大企業が得た「学び」

 2024年7月19日午前0時過ぎに行われたソフトウェアのアップデートが原因で、世界中でWindowsのPCが数百万台ダウンした。CrowdStrikeによる更新はわずか約1時間で終了したが(注3)、その影響は数日間続いた。複数の主要航空企業は作業端末の再起動や業務の復旧に追われ(注4)、数千便が欠航した。

 「CrowdStrikeのインシデントは、世界レベルの大企業の幾つかに大きな影響を与えた。まるで企業が自力で治癒しなければならない『毒』のようなものだった」(ベンダーズ氏)

 経営幹部を対象としたParametrixの調査によると、フォーチュン500に選出された企業がCrowdStrikeのシステム障害による損失を合計した額は54億ドルに達したという(注5)。Delta Air Linesは5日間で5億ドルを失った。これにより、ITのレジリエンスと復旧計画が重要課題として浮上した。

 「クラウドプロバイダーの障害のようなインシデントが発生した場合、原因が直ちに明確になることは稀(まれ)だ。警報が鳴り続け、インシデント対応チームのサポートを求めるチケットが発行され続けて大混乱に陥る。最初の段階でできることは問題の把握だけだ」(ベンダーズ氏)

 大手ベンダーが発生させた障害や、大企業のサイバーセキュリティ被害はニュースによく取り上げられる。しかし、小規模な障害が無数に積み重なって引き起こされるケースの方がはるかに一般的だ。回答者が経験したダウンタイム回数の中央値は年間232回で、半数以上の企業が週単位で影響の小さな障害を経験している。

 影響の小さい問題の場合、損失額を把握することが難しい場合もある。しかし、小規模なIT障害であっても、エンジニアリングチームがその原因を特定し、解決するために要する時間は数分〜数時間に上る。年間を通じて、チームはIT障害に対応するために約134時間、つまり約6日間分を費やしている。

 「結局は損失額の問題だ。仮に1000件のインシデントが発生したとしても損失額がゼロなら、それはインシデントとは呼ばない」(ベンダーズ氏)

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。