DeepSeekに新ライバル？　GPT-4o Miniより約19倍速い爆速LLMが登場：820th Lap

高水準のLLMを開発しようと、AI業界では激しい企業競争が繰り広げられている。LLMと言えば「DeepSeek」が色んな意味で話題だが、また新たな爆速LLMが開発されたという。

[キーマンズネット] PC用表示関連情報

LINE

Hatena

　生成AIのエンジン部分を担う大規模言語モデル（LLM）。文章や画像の生成、プログラミングの補助やカスタマーサポートなどにおいて、高い処理性能を持つLLMほど高速な処理が可能だ。

　LLMと言えば中国発の「DeepSeek」が話題だが、またもや新たなLLMが開発されたと話題になっている。「GPT-4o Mini」と比べると、なんと約19倍もの速度優位性があるという。「ChatGPT」などの一般的な生成AIとは異なる点があるというが、一体何が違うのか？

　話題のLLMとは、一般的なLLMの10倍以上の処理速度を誇る「Mercury Coder」だ。2025年2月27日にInception Labsがリリースした。

　Tech系情報サイト「Ars TECNICA」が2025年2月28日に掲載した記事によれば、Mercury CoderはChatGPTなどの一般的なLLMとは異なる拡散モデルを採用しているという。

　一般的なLLMで採用されているのは、単語を生成する際に左から右へトークンを1つずつ構築する「自己回帰型モデル」だ。前の単語が生成されてから次の単語が生成されるため、長文の生成には時間がかかる。

　一方でMercury Coderは、画像生成AIに利用される拡散モデルをテキスト生成に応用した拡散モデル「Large Language Diffusion with mAsking」（LLaDA）を採用している。自己回帰型モデルとは異なり、ノイズからテキストを引き出し並列的に生成することが可能だ。ここで言う「ノイズ」とは、初期状態のランダムなトークンを示す。Mercury Coderは、テキストやトークンからノイズを除去しながら意味のある文章を復元する。

　Inception Labsは画像生成AIモデルと同様にニューラルネットワークをトレーニングし、最も可能性の高い結果を予測した上で実際の回答と比較することでLLaDAを構築したという。LLaDAは間違いに対処しながらテキストなどを生成することが可能だ。

　Inception LabsのベンチマークテストではGPT-4o Miniが毎秒59トークンだったのに対し、Mercury Coder Miniは毎秒1109トークンで動作した。つまり、約19倍もの速度優位性があるということだ。また並列処理が可能なことから、「Nvidia H100 GPU」で1秒当たり1000トークン以上の生成が可能だ。これは専用カスタムチップを搭載したシステムに匹敵する速度だという。

　Inception Labsは、高速動作が可能なMercury Coderは開発者の生産性向上に寄与するとしている。例えばコード補完ツールや会話型AIアプリ、モバイルAIアプリのようなリソースが限られた環境や、迅速な回答が求められるシーンで役立つ。

　AI研究者のサイモン・ウィリソン氏は、Ars TECNICAのインタビューで「トランスフォーマー（訳注：現存のLLM）に代わるアーキテクチャを模索する人がいるのは素晴らしいことだ。LLMにおいて、私たちが探求できていない領域がどれだけあるかを示す1つの例証だ」とMercury Coderを称賛した。また元OpenAIの研究者アンドレイ・カーパシー氏も自身の「X」（旧Twitter）で「この言語モデルには他とは違う可能性がある」とコメントした。

　デモサイトでは、Mercury Coderのベータ版を試用できる。まだ正確性は怪しいものの、拡散モデルによる独特なテキスト生成が体験できるため興味のある人はぜひ触れてみてはいかがだろうか。

上司X：　ノイズからテキストを生成する超高速LLMが登場した、という話だよ。

ブラックピット：　ノイズ、ですか。

上司X：　ランダムなテキストということらしい。理屈としては画像生成に使うようなプロセスをテキスト生成に応用するということだが。

ブラックピット：　これから主流になりますかね？　まあ、そもそも僕は基本的なLLMの仕組みもよく知らないです。ノイズでもなんでもいいんじゃないですか。

上司X：　またそういうことを。処理が高速になるのは魅力的じゃないか。

ブラックピット：　自分で使ってる限りでは、遅いなと思うシーンもそれほどないんですけどね。

上司X：　キミは良くてもさ、コード生成に生成AIを使っているエンジニアにとっては処理が速いことは十分な魅力だろう？

ブラックピット：　そうかもしれませんが……。忙しさ解消のために生成AIで仕事の生産効率を上げすぎると、もっと多くの仕事をこなさなければならなくなって、結局もっと忙しくなる……。なんてことになりませんか？

上司X：　それ、あり得るかもな（笑）。空いた時間にさらに仕事を詰め込んじゃったりしてな。まあ、そうならないようにうまくバランスを取りながらAIを活用していくことは今後の課題になりそうだよな。ともかくだ、新たなLLMの誕生を見守りたいものだよ。

ブラックピット（本名非公開）

年齢：36歳（独身）
所属：某企業SE（入社6年目）

昔レーサーに憧れ、夢見ていたが断念した経歴を持つ（中学生の時にゲームセンターのレーシングゲームで全国1位を取り、なんとなく自分ならイケる気がしてしまった）。愛車は黒のスカイライン。憧れはGTR。車とF1観戦が趣味。笑いはもっぱらシュールなネタが好き。

上司X（本名なぜか非公開）

年齢：46歳
所属：某企業システム部長（かなりのITベテラン）

中学生のときに秋葉原のBit-INN（ビットイン）で見たTK-80に魅せられITの世界に入る。以来ITひと筋。もともと車が趣味だったが、ブラックピットの影響で、つい最近F1にはまる。愛車はGTR（でも中古らしい）。人懐っこく、面倒見が良い性格。

DeepSeekに新ライバル？ GPT-4o Miniより約19倍速い爆速LLMが登場：820th Lap

ブラックピット（本名非公開）

上司X（本名なぜか非公開）

DeepSeekに新ライバル？　GPT-4o Miniより約19倍速い爆速LLMが登場：820th Lap