メディア

「GPT-4o」を軽く超越か 世界が注目する最新AI言語モデルは何がスゴい?:812th Lap

生成AIの性能を左右するのがLLM(大規模言語モデル)だ。現在、多数のLLMが存在するが、OpenAIのLLMを脅かすほどの性能を持つ新たなLLMが生まれたという。

» 2025年01月17日 07時00分 公開
[キーマンズネット]

 生成AIの普及が進む現在、多数のLLM(Large Language Model:大規模言語モデル)が存在する。急速に技術革新が進む分野だからこそAI企業は高水準のLLMの開発を急ぎ、厳しい開発競争が繰り広げられている。

 そんな開発競争が劇化するAI分野だが、2024年の終盤に驚くほど高性能なAI言語モデルが登場したという。OpenAIの「GPT-4o」を脅かすとも言われているが、世界が注目する最新の言語モデルは何がスゴいのか?

 競争激しいLLM領域で大きく注目されているのが、中国のAI企業DeepSeekだ。同社は2024年12月26日に「DeepSeek-V3」という言語モデルを発表した。そして、Tech系メディア「TestingCatalog」が同日にそれに関する記事を掲載して話題を呼んだ。

 記事によれば、DeepSeekが発表したDeepSeek-V3は同社が開発した前バージョンのLLM「DeepSeek-V2」よりも3倍高速で、機能も大幅に強化された。しかも、DeepSeek-V3はオープンソースとして公開されている。

 DeepSeek-V3は6710億のパラメーターを持ち、これまで最大のオープンソースの言語モデルとされてきたMetaの「Llama 3.1 405B」が保持する4050億パラメーターを大幅に上回る。また、トレーニングにはNVIDIAのGPU「H800」を使って約278万8000GPU時間を割いたという。そして、トレーニングにかかったコストは約557万ドル、日本円にして約8億8000万円だという。一般的にLLMの事前トレーニングにはかなりのコストが必要とされるものの、多くても数千億円レベルだというからかなり安価なことが分かる。

 DeepSeek-V3は複数の専門モデル(エキスパート)の中から最適な言語モデルを選択する「Mixture of Experts」(MoE)アーキテクチャを採用し、計算効率と処理性能を両立している。さらに負荷分散によって、パフォーマンスを維持しながらネットワークの負荷を動的に調整する機能も搭載している。加えて「Multi-Token Prediction」(マルチトークン予測)によってさらなる効率化と負荷軽減を実現した。

 DeepSeekはDeepSeek-V3のベンチマークテストの結果も公表していて、「Qwen2.5 72B」「Llama 3.1 405B」「Claude 3.5 Sonnet-1022」「GPT-4o 0513」などの名だたるLLMにも劣らない機能を有するとアピールしている。特に中国語処理においては抜きん出ていて、中国企業としてのポテンシャルを十分に発揮しているようだ。

 前述したようにDeepSeek-V3はオープンソースで公開されているが、API利用も可能だ。その場合の価格は入力時100万トークン当たり0.27ドル、出力時は100万トークン当たり1.10ドルだという。

 中国語ベースの機能については折り紙付きのようだが、一部の識者によれば英語をはじめとする他言語での処理能力はまだ分からないという。果たして今後中国発のLLMが世界を席巻するようなことになるのだろうか。注目したいものだ。


上司X

上司X: 中国のIT企業が開発したDeepSeek-V3の性能がどうもスゴいらしい、という話だよ


ブラックピット

ブラックピット: なるほど。ChatGPTのGPT-4oに匹敵するか、それを上回る性能のLLMということですね。DeepSeek、聞いたコトないですが。


上司X

上司X: 俺も初めて聞いた。機能はスゴいみたいだが、LLMの性能って一概には比較しにくいけどね。


ブラックピット

ブラックピット: でもDeepSeekのサイトではベンチマークテストの結果も掲載されてるんでしょう?


上司X

上司X: そうなんだよね。それを見る限り、どれも性能は高い。


ブラックピット

ブラックピット: ならば、やはりDeepSeekがこれからのLLMの覇権を握るのでは?


上司X

上司X: ま、LLMの性能だけでは推し量れない部分もある、UIや得意なタスクなどな。あとは、価格も重要だな。毎月何十ドルも必要だとするとちょっとな。


ブラックピット

ブラックピット: いろいろ細かいことを言いますねえ。僕はそこまでAIに頼り切ってはいないので、ほんのちょっとしたことに納得いく回答があればそれでいいです。たまに使って、ある程度便利ならそれでオッケーですよ。


上司X

上司X: 今後はそうも言ってられなくなるかもよ。何かにつけてAIを使わないと話が始まらない、なんてことも。まあ、そんな妄想はともかくだ、今後このDeepSeekがどういう評価を受けるのかはちょっと楽しみだな。

川柳

ブラックピット(本名非公開)

ブラックピット

年齢:36歳(独身)
所属:某企業SE(入社6年目)

昔レーサーに憧れ、夢見ていたが断念した経歴を持つ(中学生の時にゲームセンターのレーシングゲームで全国1位を取り、なんとなく自分ならイケる気がしてしまった)。愛車は黒のスカイライン。憧れはGTR。車とF1観戦が趣味。笑いはもっぱらシュールなネタが好き。

上司X(本名なぜか非公開)

上司X

年齢:46歳
所属:某企業システム部長(かなりのITベテラン)

中学生のときに秋葉原のBit-INN(ビットイン)で見たTK-80に魅せられITの世界に入る。以来ITひと筋。もともと車が趣味だったが、ブラックピットの影響で、つい最近F1にはまる。愛車はGTR(でも中古らしい)。人懐っこく、面倒見が良い性格。


Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。