データ分析とは、収集し加工を施したデータから何らかの知見を引き出すことだ。「Microsoft Excel」(以下、Excel)などの表計算ソフトやBIツールなどで行われる(詳細はページの末尾へ)。
日々の仕事の中で顧客の履歴や従業員の情報、センサーやソフトウェアのログなどのさまざまなデータに触れて、「これを分析すれば何か役に立つことが分かるかもしれない」と考える人も多いだろう。しかし「そもそも何のために分析をしているのか」「どのようなアウトプットが得られればゴールなのか」が明確にならないまま分析を始めると、役に立たないアウトプットになってしまったり、分析の出口が分からなくなったりしてしまう。このようなことを避けるためには、一般的に「PPDACサイクル」に沿って進めることが望ましいとされる。
PPDACサイクルとはデータを用いた問題解決の手法で、「Problem(問題)」「Plan(計画)」「Data(データの収集、整理)」「Analysis(分析)」「Conclusion(結果の考察、解決策の提示)」の頭文字を取ったものだ。
まず、現在抱えている課題を明確化し、その課題の解決度を示す定量的な目標を設定する。これによって「どの数字をどの程度上げるための施策を考えればいいのか」というデータ分析の目的が明確化され、今後のプロセスに向けた道筋を立てられるようになる。
次に、「Problem」で設定した目標の値に影響を与える変数を考え、「この指標を上げれば(下げれば)目標達成に貢献できるのではないか」という仮説を立てる。その仮説の検証に必要なデータや資料が何かを考え、調査計画や分析計画を立てる。
このプロセスでは、必要なデータを収集し、分析可能な形に整理する。経営判断に必要な売り上げのデータを営業担当が販売管理システムに入力したり、人事施策の検討に必要な各従業員のパフォーマンスのデータは各部門のマネジャーがタレントマネジメントシステムに入力したりといった具合だ。データウェアハウス(DWH)やデータベース管理システム(DBMS)などデータを一元管理するシステムを導入すれば、データを統合する手間を省くことができる。
収集したデータは、必要に応じて加工する必要がある。複数のソースから収集したデータを統合したり、分析しやすい形にデータを修正したりする作業だ。DWHやDBMSでSQLを実行して処理したり、Excelで行ったりする。
分析に適した形にデータを加工したら、いよいよ分析のフェーズに入る。あらかじめ設定した分析の目的や計画に沿って、必要に応じて集計や統計解析を行う。
Excelの「ピボットテーブル」やグラフ描画機能で手軽に分析することもできるが、継続的、自動的に集計結果を見たい場合はBIツールを使ったり、高度な分析を行いたい場合は統計解析ツールを使ったりするなど、その方法はさまざまだ。
最後に仮説検証の結果を考察し、それを基に売上改善策や人事施策、マーケティングプランを検討するなどのアクションに入っていく。
実のある施策案を提示するには、「Problem」でクリティカルな課題を設定できているか、「Plan」で効果的な仮説を立てられているかが肝になる。
データ分析のプロセスではさまざまなツールが役に立つ。以下で挙げるのはその一例だ。見出しがそれぞれのツールに関するページへのリンクになっているので、機能や選定ポイントなどの詳細はそちらで確認してほしい。
データウェアハウス(DWH)とは、大量のデータを格納するシステムのことだ。ただ格納するのではなく、分析のために整理して格納するのが特徴だ。
クラウド型のデータウェアハウスであれば、サーバやストレージなどのインフラをはじめ、データベースやETLソリューション、場合によってはBIツールを含めたフロントエンドのデータ分析環境まで、必要な機能を全てクラウドから調達できる。
ExcelはMicrosoftが提供する表計算ソフトだ。格納するデータ量に制限があるため、大量のデータの格納や分析には向かないが、数百から数千行程度のデータを手軽に分析する際に役に立つ。
関数やグラフ、ピボットテーブル機能を使った自由度の高い分析が可能な反面、データの加工や分析のプロセスがブラックボックスになりやすいという欠点もある。
BIツール(Business Intelligenceツール)は、企業が持つ大量のデータから必要な情報を取り出し、分析や可視化を行えるツールだ。
BIツールは、直感的なユーザーインタフェースやドラッグ&ドロップの操作でデータ分析が行えるため、非エンジニアでも利用できる。一方、従来のデータ分析ツールは、プログラミングやSQLの知識が必要な場合がある。特に「セルフサービスBI」と呼ばれるツールでは、従来はエンジニアやIT部門に依頼する必要があったような分析を、ユーザーが自ら実行し必要な情報を取得できる。
また、従来のデータ分析ツールでは、データの取得や読み込み、集計などを都度行う必要があったが、BIツールにデータベースを接続すれば、データをリアルタイムに分析・可視化できる。データ分析にかかる工数を削減できることもBIツール導入の利点と言える。
統計解析ツールは多変量解析などの高度な分析を行えるツールだ。テキストマイニングツールを使用すれば、文章を対象にデータマイニングを行うこともできる。
「IBM SPSS」などGUIで高度な分析が可能なツールもあるが、RやPythonなどオープンソースのプログラミング言語で自由度の高い分析をすることも可能だ。
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。