Box Japanは、最新AIモデルGPT-5.2を評価基盤で検証し、処理速度と複雑な推論能力の両面で大幅な向上を確認した。企業のAI活用の実用性が一段と高まっている。
Box Japanは2025年12月12日、OpenAIの最新AIモデル「GPT-5.2」がリリースされたことを受け、Boxが提供する評価基盤「Box AI Enterprise Eval」を用いて同モデルを検証した結果、処理速度と複雑な推論能力の両面で明確な進化が確認されたと発表した。AIモデルを特定分野や業務に特化させる流れが広がる中、GPT-5.2はその動向を象徴する存在と位置付けられている。
GPT-5.2は専門的な知識を要するテーマへの対応力を高めると同時に、応答までの時間を短縮した点が特徴だとBoxはみている。Medium Reasoningや長いコンテキストを必要とする利用場面が想定されており、GPT-5とGPT-5.1との比較を実施したところ、最初のトークンが返るまでの時間が大きく改善されている。複雑な処理を伴う業務でも、回答待ちによる作業の停滞が起きにくくなった。
具体的な数値として、複雑な情報抽出に要する時間がGPT-5では46秒、GPT-5.1では17秒であったのに対し、GPT-5.2では12秒に短縮された。分析的なクエリでも、インサイト取得までの時間がGPT-5の19秒、GPT-5.1の9秒から、GPT-5.2では7秒となった。マルチターンクエリにおいては、GPT-5が10秒、GPT-5.1が5秒であったのに対し、GPT-5.2は5秒で応答したという。
推論能力については、Boxが複雑な業務の自動化を想定して設計した「Box AIベンチマーク」による評価結果を公表した。最新の評価セットでは全業界の平均推論スコアがGPT-5.1の59%からGPT-5.2では66%へと上昇した。分野別ではメディア&エンターテインメントが76%から81%、金融サービスが67%から71%、ライフサイエンスとヘルスケアが57%から59%に向上した。
Boxはこうした性能向上により、Box AIを用いた業務活用の幅が広がると説明する。メディア&エンターテインメント分野では公開期間が短縮される中で、興行成績を左右する市場要因をデータに基づいて分析し、意思決定に生かす重要性が高まっている。Box AIは、複数のスプレッドシートや資料を読み込み、国内外の収益比率を算出し、市場別に整理することで、フランチャイズ単位の傾向を短時間で示せる。
金融サービス分野では投資や融資の判断において迅速かつ正確な情報整理が求められる。Box AIは融資関連書類一式から主要条件を正規化し、比較表を作成できる。金利や担保、契約条件、リスク条項などを一覧化し、例外や集中リスクを示すことで、文書確認に要する時間を大きく削減できるとしている。
ライフサイエンスとヘルスケア分野では論文や治験記録、規制関連資料といった非構造化データの整理が課題とされる。Box AIは、PDFやスライド資料を対象に、エンドポイントや患者群、主要な成果や有害事象を抽出し、相違点を整理した上で構造化されたエビデンス表や要約を作成できると説明した。
Boxは、GPT-5.2が「Box AI Studio」およびBox AI APIを通じて利用可能になったことを明らかにし、専門性の高い文書や複雑な業務での活用を呼びかけている。Boxの発表は、企業へのAI活用の実用性が一段と高まったことを示す内容となっている。
Anthropic、「MCP」をLinux Foundation傘下AAIFへ寄付 “AIの健全な発展”に向けて
「技術だけ変えても“江戸時代”のまま」 Gartnerが示す「AI共生時代」に必要なマインドセット
リコーがGoogle「Gemma 3」ベースの日本語LLMを開発 オンプレミスでの導入に最適化
「従来の自動化ツールは硬直的で技術的」 新機能「Google Workspace Studio」はどれだけ手軽なのかCopyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。