メディア

Windowsの停止に「対応できた企業」と「できなかった企業」 何が違いを生んだのか

CrowdStrikeのソフトウェアが原因となってWindowsが起動しなくなる事態が起こった。混乱の中で素早く復旧できた企業とそうでなかった企業では何が異なっていたのだろうか。

» 2024年09月27日 07時00分 公開
[Matt AshareCIO Dive]
CIO Dive

 CrowdStrikeのセキュリティソフトウェアの不具合により、全世界で850万台の「Windows」が起動しなくなった。これはITに頼る企業の運営に大きな影響を及ぼした。

対応できた企業とできなかった企業の違いは

 特に明暗が分かれたのが航空産業だ。何が違いを生んだのか、事例を紹介する。

 登場する企業は米国の三大航空会社のうちの2つ、United AirlinesとDelta Air Linesだ。United Airlinesは2024年7月19日に起こった危機に素早く対応でき、Delta Air Linesはそうではなかった。

 United Airlinesのスコット・カービー氏(CEO)は、2024年7月22日付の従業員と顧客に宛てた文書の中で「CrowdStrikeのソフトウェアアップデートの不具合による3日間の運航中断から完全に回復した」と述べた(注1)。

 「2024年7月22日、United Airlinesのオペレーションは正常な状態に戻り、この24時間、システムやツール、スケジュールは安定している。一定の時間は必要だったが、このような状況にあって復旧は早かった」(カービー氏)

 カービー氏によると、世界365カ所の空港にあるコンタクトセンターで、技術者チームが2万6000台以上のコンピュータやデバイスを1台ずつ手作業で修復し、再起動させたという。Microsoftは2024年7月20日の声明で「CrowdStrikeによる2024年7月19日のアップデートが全世界で推定850万台のWindowsデバイスに影響を与えた」と述べた(注2)。

 CrowdStrikeのバグはUnited Airlinesのシステムを直撃し、同社は2024年7月19日に合計694便のフライトをキャンセルした(注3)。IT障害により、週末にはさらに合計713便が欠航した。カービー氏は、この週末を「年間で最も忙しい旅行シーズンの一つだった」と表現した。

 追跡サービスを提供するFlightAwareによると(注4)、システムが復旧するにつれ、United Airlinesの欠航は2024年7月22日には合計69便、同年7月23日の午後には合計47便に減少した。これは、それぞれ当日予定されていたフライトの2%、1%に相当する。

 全ての航空企業がこれほど幸運であったわけではない。

深刻な影響を受けたDelta Air Lines

 米国内の航空企業の中で最も大きな打撃を受けたのはDelta Air Linesで、7月19日に続き週末に合計3500便以上の欠航を出した。FlightAwareが500件近くのキャンセルを集計した2024年7月23日の午後、同社はまだ業務を成城に回復させようと奮闘している最中だった。

 調査企業のForrester Researchのブレント・エリス氏(シニアアナリスト)は、CIO Diveに対して次のように語った。

 「障害の性質上、対応能力は影響を受けたエンドポイントに直接介入するために利用可能なリソースに大きく依存する。スタッフの配置やセキュリティ、重要なエリアにおけるデバイスの能力が、Delta Air Linesに最も深刻な影響を及ぼすことにつながった」

 Delta Air Linesのエド・バスティアン氏(CEO)は、2024年7月22日においても中断されているサービスについて、乗務員を再配置するソフトウェアに問題があったと発言した。Southwest Airlinesも、2022年12月の運行停止の原因を同様のソフトウェアの故障に結び付けている。この障害により、ホリデーシーズン中に約1万7000便がキャンセルされた(注5)。

United Airlinesの復旧が早かった理由

 CrowdStrikeの障害が世界中のITシステムに影響を及ぼしたまさに前日の2024年7月18日、United Airlinesのカービー氏はマイケル・レスキネン氏(最高財務責任者兼エグゼクティブバイスプレジデント)と共に、過去の運航障害時の復旧時間とコストを削減するために尽力した自社のオペレーションチームとテクニカルチームを次のようにたたえた。

 2024年7月18日に開催さえた2024年第2四半期の決算説明会において(注6)、レスキネン氏は「この1年間、オペレーションチームは技術に投資し、不規則なオペレーションからの復旧を改善するためにプロセスを改善してきた」と語った。

 カービー氏は「オペレーションチームは、CIO(最高技術責任者)であるジェイソン・バーンバウム氏によるサポートを受けながら、恒常的なコスト削減が可能な領域を見付け出して対応した」と付け加えた。

 給与と燃料費というUnited Airlinesにおける最も大きな2つの費用が前年同期比で11%増加したにもかかわらず、同社の第2四半期の営業総支出はわずか3%増にとどまった。

 大規模な移行が2024年の初めに完了しようとする中、レスキネン氏はクラウドの長期的なメリットについて説明した。それには効率の向上が含まれ、同氏は「時間の経過とともにコスト削減につながる」と述べた。しかし、即時に利益につながるかどうかは確実とは言えない状況だった。

 第1四半期の決算説明会において(注7)、レスキネン氏は「メインフレームを停止しない限り、クラウド移行によるコスト削減は実現しない」と述べていた。

 運営の改善により、即時的なリターンが得られた結果、United Airlinesは第2四半期に13億ドルの純利益を計上し、前年同期比で23%の増加を達成した。同社は2024年の最初の3カ月間に、ボーイング機の一部の運航停止を原因として1億2400万ドルの純損失を計上していた。

 経営陣はCrowdStrikeの障害を予測できたわけではなかった。しかし、今回のIT障害からの復旧の早さは、United Airlinesがプロセスと技術の改善に投資してきた事実を明らかにするもので、先見の明を感じさせた。

 経営コンサルティング企業のWest Monroeのクリスティーナ・パワーズ氏(サイバーセキュリティ部門のパートナー)は次のように述べた。

 「乗務員の追跡、予約や再予約、スケジューリングといった複雑なプロセスをサポートするために技術に大きく依存している業界では、ベンダーがソフトウェア製品をどのように、いつ更新するのかを理解し、それが自社の運用にどのような影響を与えるかを把握することが重要だ」

 「一方、ソフトウェアプロバイダーにおいては、機能性や互換性、セキュリティに関する十分なテストを含む慎重なリリースプロセスを持つことが極めて重要だ」(パワーズ氏)

© Industry Dive. All rights reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。