
データ・プレパレーション・プラットフォーム 「Paxata」
分析に必要なデータをユーザーがセルフサービスで準備できる
ビッグデータやIoT、クラウドなど先進分野でのデータ分析に求められる「データ準備」を機械学習などの最新テクノロジーを活用して素早く実現する。
<おすすめユーザー> 機械学習や分析のためのデータをExcelで加工・変換している企業。
データ加工にかかる作業を効率化/自動化したい企業。
ダウンロード資料
- データ・プレパレーション・プラットフォーム「Paxata」(1.3MB)
- データ・プレパレーション・プラットフォーム「Paxata」について、初めてご覧いただく方向けに分かりやすく説明した製品カタログ。
- Paxata機能ガイド(1.3MB)
- Paxataのデータ・プレパレーション機能ガイドブック。データの変換や整形、名寄せ、統合など7つのメイン機能をご紹介。
- はじめてのデータ・プレパレーション(4.9MB)
- これから検討をスタートする方向けの入門ガイド。データ・プレパレーションが注目される背景や、押さえておきたいキーワードを解説。
- Excelを使わない10の理由 〜企業のデータ・プレパレーション編〜(5.6MB)
- Excelは扱えるデータの種類や件数に制限があり、VLOOKUPなどの関数も必要となります。Excelでのデータ準備を解決するポイントを10の理由にまとめています。
分析に必要なデータをユーザーがセルフサービスで準備できる
ビッグデータ・IoT全盛の時代を迎え、さらに、セルフサービスBIツールの導入が進む今、データ分析・活用に取り組もうとする企業は多い。そこで直面する課題が、分析するうえで必要となるデータ準備の手間だ。データ分析にかかる全作業のうち、80%もの時間がデータ準備に費やされているともいわれる。
そこで、ビジネス部門のユーザーやアナリスト自身がデータ分析できるように、分析に必要なデータの準備をセルフサービスで実現できるようになる「データ・プレパレーション」が注目されている。
【キーワードは「データの可視化」と「データ・マネジメント」】
Paxataは、業務部門のユーザーが、システム担当に依頼しなくても自分自身でデータを加工することができるデータ・プレパレーション・プラットフォームだ。
構造化データはもちろん、XMLやJSONなどの非構造化データもスキーマレスに格納し、ユーザーはその全てのデータをスプレッドシート上で可視化しながら加工できる。Paxataは、スピーディーなデータ準備で、企業のデータ分析の成功を支援する。
【Paxataが実現できること】
●社内外のさまざまなシステムのデータを連携・統合して、誰もが自由に分析に活用できるデータを提供
●XMLやJSONなどの非構造化データやテーブルデータ、CSVやWebアクセスログなど多種多様なフォーマットのデータを連携
●大量データの処理にも対応できる高速かつスケーラブルな構成で、データや利用者の増加に対応
●IT部門でデータの統制を効かせつつビジネスユーザー自身で自由なデータ加工が可能なシステムを構築 など
【クラウドでいつでも利用スタート】
クラウドサービスの「Paxata Cloud」で、いつでもPaxataの利用を開始できる。データ量に応じてS/M/Lの3モデルから選択するだけで、Webブラウザから必要なデータを準備できるようになる。

基本情報
製品形態 | ソフトウェア |
---|---|
保守サポート | - |
サポートエリア | 全国 |
こだわりポイント | - |
導入実績 | - |
仕様
メーカー | Paxata |
---|---|
クライアント側OS | - |
クライアント側対応プロセッサ | - |
クライアント側必要メモリ容量 | - |
クライアント側必要ディスク容量 | - |
クライアント側その他動作環境 | Mozilla Firefox: Extended Support Release (ESR) 58.0.2 for Mac and Windows Google Chrome 64.0.3282.140(Official Build)(64-bit)for Mac and Windows |
サーバ側OS | CentOS 64bit 6.4、6.5、6.6、6.7、7.2、7.3、7.4 Red Hat Enterprise Linux 64bit 6.4、6.5、6.6、6.7、7.2、7.3、7.4 |
サーバ側対応プロセッサ | Core Server:10Core以上、2.XGHz以上 Pipeline Master Server:8cores以上、2.XGHz以上 Pipeline Worker Server:合計36cores以上推奨、2.XGHz以上 |
サーバ側必要メモリ容量 | Core Server:60GB以上(*) Pipeline Master Server:30GB以上(*) Pipeline Worker Server:コア数により変化、1コアあたり8GB (*)データ量や同時処理数によってより大容量のメモリが必要 |
サーバ側必要ディスク容量 | Core Server:1TB以上、SASもしくはより高速なディスク Pipeline Master Server:250GB以上、SASもしくはより高速なディスク Pipeline Worker Server:250GB以上、SASもしくはより高速なディスク |
サーバ側その他動作環境 | 【Java Platform】 JDK1.8 update60以上 【リポジトリDB】 MongoDB 3.4、3.2 【ネットワーク構成】 10 Gigabit Ethernet(10GbE)最低10GbEがサポートされるネットワークインフラ |
その他特記事項 | 【サポートされるHadoop Distribution】 Cloudera CDH 5.7、5.8、5.9 Hortonworks HDP 2.4、2.6 AWS EMR 5.4 / AWS S3 Azure HDInsight 3.6 / Azure Blob Storage |
価格情報
- サブスクリプション・ライセンス(年間)
掲載企業
ダウンロード資料
- データ・プレパレーション・プラットフォーム「Paxata」(1.3MB)
- データ・プレパレーション・プラットフォーム「Paxata」について、初めてご覧いただく方向けに分かりやすく説明した製品カタログ。
- Paxata機能ガイド(1.3MB)
- Paxataのデータ・プレパレーション機能ガイドブック。データの変換や整形、名寄せ、統合など7つのメイン機能をご紹介。
- はじめてのデータ・プレパレーション(4.9MB)
- これから検討をスタートする方向けの入門ガイド。データ・プレパレーションが注目される背景や、押さえておきたいキーワードを解説。
- Excelを使わない10の理由 〜企業のデータ・プレパレーション編〜(5.6MB)
- Excelは扱えるデータの種類や件数に制限があり、VLOOKUPなどの関数も必要となります。Excelでのデータ準備を解決するポイントを10の理由にまとめています。
掲載日:2018/03/01
更新日:2018/11/02
掲載内容は掲載日、更新日時点のものです。変更となる場合がございますのでご了承下さい。