三菱地所が目指すデータ活用になぜiPaaSが必要だったのか
グループ全体のタッチポイントを生かしたデータドリブン経営を目指す三菱地所。同社はその前提となるデータの収集や整形、蓄積、分析の仕組みをiPaaSで構築した。
「従来のシステムでは、データの扱い方の全体像を整理できていませんでした」――。こう語るのは「グループIT基盤の整備を担う芦垣潤平氏(三菱地所 DX推進部 マネージャー)だ。
同社は「事業データを集約し、活用するための基盤がない」「SaaS(Software as a Service)と社内システムを人手で連携する必要がある」といった課題を抱えていた。これに対処するために同社はiPaaS(integration Platform as a Service)を使ったデータ連携基盤を構築した。
本記事は「Informatica World Tour 2022」での芦垣氏の講演「三菱地所が考えるクラウド時代におけるデータ連携基盤の在り方について」をもとに編集部で再構成した。
三菱地所が目指すデータ活用になぜiPaaSが必要だったのか
オフィスビルや商業施設、住宅などの開発・賃貸・販売・管理・リフォームといった不動産に関する多様な事業を展開する三菱地所。住宅分野では35万戸のマンションを管理し、運営する商業施設には年間2億人超の来客がある。
三菱地所はこれら顧客とのタッチポイントを生かした街づくりに取り組んでいる。スマホアプリを介して、顧客にオンラインとオフラインを融合した“まち”での体験を提供し、アプリから収集したデータを分析・最適化して顧客に還元する「まちのUX Loop」を構想する。
まちのUX Loopを実現するためにはデータを「収集・整形」「蓄積」「分析」する仕組みが必要だった。そこで、まずはビッグデータを処理するフレームワークとして「Lambda Architecture」(ラムダアーキテクチャ)を検討した。ラムダアーキテクチャとは、バッチ処理とストリーム処理の両方の方法を利用して大量のデータを処理するように設計されたデータ処理アーキテクチャだ。
しかし調査を進めると、同アーキテクチャ―はバッチレイヤーやスピードレイヤーに共通の仕組みが存在していないことが判明。さらに、データを「収集・整形」「蓄積」から「分析」にまで効率的に運ぶためのデータ連携基盤や、社内システム間のデータ連携基盤が不十分という問題が見えてきた。
この分析を受けて、同社は自社に必要なものが「効率的にデータ統合を実現する仕組み」と、「SaaSと社内ネットワークを連携できる仕組み」であると結論付けた。
三菱地所の要求を満たすデータ連携基盤を実現する手段として採用されたのは、インフォマティカのエンタープライズiPaaS製品「Informatica Intelligent Cloud Services」(IICS)だ。
採用を決めた理由として芦垣氏はまず、「ローコード開発が可能であること」を挙げた。SQLについてはある程度理解しているが、高度なプログラミングのスキルを有していない同社のDX推進部が、データ連携プロセスを内製化するケースにマッチすると考えたのだ。「データ統合と相互データ連携の両方をカバーできる機能と性能がある」「Amazon Web Services(AWS)で運用中のシステムと相性が良く、接続性、可用性、拡張性に優れている」ことも評価したポイントだった。
同社が普段使用している「GitHub」を活用してデータのアセット管理を行える点は、導入後に気付いたメリットだ。
効率的なデータ収集や分析を実現
IICS導入後のデータ分析アーキテクチャの全体像は、図3のようになった。バッチレイヤーにおいてIICSが中核的な役割を担っている。ストリーミングデータレイヤーについては現在整備中だ。パブリッククラウドとIICSの双方に備わる機能を活用したこのデータ連携基盤では、データ処理用のサーバソフトウェアである「Secure Agent」を導入し、複数のタスクフローを実行している。社内ネットワークおよびインターネット経由のいずれでも効率的にデータを連携できる。
三菱地所はこのデータ連携基盤で3つのタスクを実行している。一つは、収集した生データをデータレイクである「Amazon Simple Storage Service」(Amazon S3)に格納するタスク。二つ目は、データレイクにあるデータを整形して、データウェアハウス(DWH)の「Google BigQuery」に連携させるタスク。そして三つ目は、DWHに格納したテーブルをさらにデータマートとして活用するために、結合したり加工したりするタスクだ。なおこれらのタスクの実行には、IICSの機能の一つである「Informatica Cloud Data Integration」(CDI)を活用している。
データ収集時は、IICSのAPIコネクターを利用してSaaSや社内のデータベースからデータを吸い上げている。AWSの持つ機能と、定義した場所に置いたファイルを検知するIICSの「ファイルリスナー」機能を組み合わせることで、データを効率的に収集できているという。
本番環境については、パフォーマンスと可用性を考慮して、マルチAZ構成とした。「マルチAZにするとActive/Standby構成になることが多いのですが、IICSの場合はActive/Active構成にできます。リソースを無駄なく活用できています」と芦垣氏は評価する。
データ設計品質の安定化にも着手
データ統合基盤の導入を一段落させた同社が次なるステップとして取り組むのは、データ品質の安定化だ。「データソースに欠損がある」「日付がstring型になっている」「タイムゾーンがバラバラ」といった品質の低いデータで分析の上でさまざまな問題が生じる。
この問題を改善するために、データを連携させる前に、IICSの機能でソースのプロファイリングを実施し、異常のあるデータをクレンジング、標準化した上で、タスクの設計構築に着手することを試みている。 芦垣氏は、「これらの取り組みにより当社では、開発の効率化が進んでいます。また、データ分析者が本来やるべきことに時間を費やせすための仕組みを構築できています」と結んだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 創業100年ヤマト、DX推進を支える人材の育成方法がすごい
創業100年を迎えたヤマトホールディングスは、2020年からデータドリブン経営を掲げている。データドリブン経営を支えるデジタル人材の育成方法や人材配置の工夫について聞いた。 - iPaaS(Integration Platform as a Service)の利用状況(2022)/後編
広範囲な業務の自動化を目指す「ハイパーオートメーション」の文脈でiPaaS(Integration Platform as a Service)の有用性がうたわれている。一方で、「エンドユーザーコンピューティングという地雷の再来ではないか」という不安を口にする人もいる。 - iPaaS(Integration Platform as a Service)の利用状況(2022)/前編
システム連携のコストや工数を削減し、業務自動化を実現するiPaaS。日本ではどの程度認知されているのだろうか。 - iPaaSとは? 主要製品の棲み分けやメリット、運用のポイントを総整理
SaaSの利用が増え、システム間の連携は従来と比べて複雑さを増している。そのなかで注目される、クラウドベースのシステム連携ツール「iPaaS」の特徴と、導入時のチェックポイントなどについて、Boomiの「Boomi AtomSphere Platform」を例に解説する。