データ基盤しくじり先生 テストで“見たことない額”を吹き飛ばした「うん百万の男」の話
デンソーで、異なるクラウドサービス間でのデータ連携を検証したところ、Snowflakeから同社としてはかなり高額な請求が送られるという事件が発生した。当事者が事件の真相とその後を語った。
「え、ナニコレ? となったのを今でも鮮明に覚えています」
ある日、デンソーでデータ活用基盤の整備に当たっている近藤忠優氏(デジタル活用推進部)のもとに、Snowflakeから1枚の請求書が届いた。そこには、社内で一番大きいプロジェクトで掛かったコストの3〜4倍に相当する「見たことない金額」が書かれていた。
この一件はのちに「通信コスト急増事件」と呼ばれ、近藤氏は部内で親しみを込めて「うん百万の男」と呼ばれ認知されるようになった。デンソーで何が起こっていたのか。近藤氏は2025年9月開催のイベント「SNOWFLAKE WORLD TOUR TOKYO 2025」で、その全貌を語った。
データ連携の検証で起きた“想定外”
デンソーのデジタル活用推進部は「当たり前にデータ活用で意思決定する会社になる」をビジョンに、データ活用基盤の開発や運用、育成やプロジェクト支援などを手掛けている。従来の同社は各部門やプロジェクト単位でデータ基盤を構築し運用しており、基盤開発に時間がかかったり高度なITスキルを求められる状態だった。
デジタル活用推進部は、各プロジェクトがデータの利活用や業務の適用、効果を出すことに注力してもらえるように手前の部分を担う。2020年には全社向けにデータ活用基盤を整備した。
デンソーのデータ活用基盤はSnowflakeを基本としているが、各部門やプロジェクトの業務特性や独自のニーズに合わせて「Microsoft Fabric」(Fabric)や「Databricks」を使うこともある。領域をまたいでデータを活用する場合には異なるクラウドサービス間でデータをやりとりすることになる。
デジタル活用推進部は、安全にデータ連携できるよう技術的な検証をすることになり、近藤氏はFabricの担当になった。そこで起きたのが通信コスト急増事件だ。
近藤氏は連携を検証するためSnowflakeにあったテーブル10TBをFabricに転送した。当然転送量も10TBだと思っていた近藤氏だが、調査の結果、実際に転送されていたのは520TBだった。
事件のトリックはこうだ。Snowflakeではデータをかなり圧縮して保管しており、Fabricにコピーする際、仕様の影響でこれが展開され、転送された。
「正直ショッキングな出来事であるんですけど、同時に驚いたことがありまして、Snowflakeってこんなにも高圧縮でデータを保管できていて、かなりストレージコストが抑えられている点に驚きましたし感動しました。このときは感動している場合ではなかったですけど」
どこでも起こり得ることを最初に発見した英雄
近藤さんはこの事件を理由に処分を受けたわけではない。むしろ、他の部門でも起こり得ることを発見した人物になった。これによりデンソーは再発防止策を定められた。
1つ目が早期発見だ。同社は従来、データウェアハウスの使用料を確認しており、今回のようなデータ転送量の急増を把握できなかった。そこで、Snowflakeのコスト検知機能とデンソーの新しい監視機能を組み合わせて、請求書で初めて知るという最悪の事態を回避できるようになった。
2つ目が未然防止だ。Snowflakeの機能で非効率なクエリを検出して通知するようにした。将来的にはコストに直結するクエリを実行前に予測して実行を停止するような機能に期待したいとしている。
3つ目が連携統制だ。ユーザー部門がデータ連携を検討する段階で、デジタル活用推進部が介在して技術的な検証を担当し、安全で効率的な連携のガイドラインを作る体制やルールを整備する用意した。何かあったときにすぐ相談できる関係を構築することで、今回のような事件が起きることを防ぐ。
デンソーは機能面と統制面を磨いて、より安全なマルチクラウド環境を実現するとしている。
Copyright © ITmedia, Inc. All Rights Reserved.