データ統合ミドルウェアの違いとそれぞれの特徴を確認しておこう。ETLは基本的にバッチ処理によって複数のデータベースからデータを検索/分析用途の別のデータベースに物理的に移行することを基本機能とする。従って10テラバイト以上の非常に大量のデータを処理できる半面、データの更新は早くても時間単位でデータ遅延は大きい。
一方、EAIやESBは本来、多対多のメッセージ変換とルーティング機能を提供するツールであり、アプリケーションまたはサービス間で、イベントが発生する度にその時点での処理に必要なデータを送信することが基本機能となる。従って送信するのは少量であり、データの遅延は低いが、検索や分析用途には不向きである。
昨今のように環境変化が激しい場合にはETLよりデータ遅延が少なく、かつEAIやESBよりも一度に処理できるデータ量が多いソリューションが必要となる。データ仮想統合はETLとEAI/ESBの中間で検索アプリケーションから直接データソースにアクセスし、キャッシュするので必要な量のデータを即時に利用することが可能となる。
ありとあらゆる種類のデータソースへのアクセスが求められているだけに、データ仮想化ソリューションではコネクティビティー(接続性)が大きなポイントとなる。そこで通常、データ仮想化ソリューションには、さまざまなアプリケーションやデータベースに対して接続コネクタが提供されている。
また最近では、SQLがRDBMS(リレーショナルデータベース管理システム)だけのものではなくなりつつあり、Hadoop、さらにはNoSQLのデータベースへの対応を進めつつある。IBMやオラクル、マイクロソフトといったRDBMS界の三大ベンダーが、このようにSQL自体のコネクティビティ強化に力を入れているので、もしかすると近い将来には、現在データ仮想化ソリューションが担っている、ミドルウェア層でのデータへのコネクティビティ提供の役割をSQL自体が肩代わりするようになるかもしれない。しかしいずれにせよ、データ活用が本格化するようになって行くに従い、RDBMSオンリーの時代は終焉(しゅうえん)を迎えるといっても過言ではないだろう。
後編では、データ仮想化ソリューションの具体的な活用メリットと、その選定のポイントについて言及する。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。