データウェアハウス(DWH)とは、大量のデータを格納するシステムのことだ。ただ格納するのではなく、分析のために整理して格納するのが特徴だ。
似た概念としてデータベース(DB)やデータレイク、データマートなどがある。DBはデータを1カ所に集めたシステムの総称で、多くの場合リレーショナルデータベース(RDB)と呼ばれる、行列とリレーションで構造化されたDBを指す。データレイクは画像や動画などの非構造化データも含めて全てのデータを保管するシステムのことだ。データマートはDWHで整理したデータから、さらに特定の目的に合わせて抽出したデータを管理するシステムだ。データレイクに格納されているデータを、DWHで整理し、データマートで個々の目的に合わせて加工する、という流れで、分析に必要なデータを用意する。
ビッグデータ活用への関心の高まりに象徴されるように、大量かつ多様なデータを分析することで、ビジネスの現状把握や意思決定を迅速化したい。さらには、新たな知見や洞察(気付き)を創出していこうという動きが活発化している。
とはいえ、データ分析は必ずしも最初から大きな成果が見込めるわけではない。試行錯誤を重ねながら、息の長い取り組みが必要となる。場合によっては、途中で頓挫するリスクがあることも覚悟しなければならない。
従って、必要最小限の投資でスモールスタートし、データ量やユーザー数、アクセスの増加、データ分析要件の高度化や処理負荷の増大に応じて、得られた成果とのバランスを見極めながら拡張していくことが望ましい。
そこで注目したいのが、クラウド型のデータウェアハウスだ。サーバやストレージなどのインフラをはじめ、データベースやETLソリューション、場合によってはBI(ビジネスインテリジェンス)ツールを含めたフロントエンドのデータ分析環境まで、必要な機能を全てクラウドから調達できる。
クラウドDWHのメリットは、自社で人員やデータセンターを保持しなくとも良いという点、またリソース要求の急激な変化に対応しやすい点だ。そういった意味では、1年のうち限られた期間だけデータ分析を行いたい、あるいはテスト的にデータ分析を行いたいといった要件にも対応できる。この場合、構築したデータウェアハウスの基盤を安価なアーカイブ用ストレージサービスに保存していくことで、必要になったときにいつでも再開することができる。
以下はキーマンズネットで掲載している、DWHの関連記事だ。サービスの導入、運用にぜひ役立ててほしい。
DWHの導入を検討しているなら、以下のキーワードの解説も関連分野として参考にしてほしい。
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。