AIは本当に「正直」なのか。交渉と裏切りを前提としたあるゲームにAIを参加させたところ、人間顔負けの駆け引きや、他のAIをだますような動きが見られた。AIはどんな時に協力し、そして、どこで裏切り、だまそうとするのか。
AIは時に、自身の判断や行動について事実と異なる説明をしたり、意図的に真実を隠したりすることがあるという。これは単なる誤りや幻覚(ハルシネーション)とは異なり、目的を達成するために相手の判断を誘導しようとする振る舞いだ。
こうした傾向は、あるゲームをAIにプレイさせることでより明確に確認できるという。AIは、一体どんなときに他者をだまそうとするのだろうか。
そのゲームとは「So Long, Sucker」だ。これは1950年代に数学者のジョン・ナッシュ氏らによって考案された、4人でプレイする「交渉」と「裏切り」をテーマにしたボードゲームだ。勝利するには他プレイヤーとの同盟が不可欠だが、最後に勝てるのはただ1人。
各プレイヤーには色付きチップ(青・緑・赤・白《黄》のいずれか)が渡される。中央には山札があり、カードには「どの色のチップを、誰から誰に移動させるか」が指定されている。手番では山札からカードを引き、その指示通りにチップを動かすが、対象プレイヤー同士の合意が必要な場合も多い。チップは同盟や交渉の証として機能し、最終的には一定条件を満たしたプレイヤーのみが勝者となる。
ゲーム内で同盟はいつ崩してもよく、裏切りはルール上むしろ推奨されている。誰と組み、いつ切るか、あるいは切られる前に動くか。プレイ中は常に心理戦が続く。人間関係の機微や本性が露呈する点が面白いこのゲームのWeb版が公開された。
大きな特徴は自分以外のプレイヤーをAIに任せることが可能なところだ。AIと対話しながら戦略的にゲームをプレイでき、全てのプレイヤーをAIに任せることも可能だ。どうやらこのWebサイトを作成したAIエンジニアのlout33氏(ルイス・フェルナンド・ユパンキ氏)は、そもそもAI同士の対戦にこそ興味を持っていたようだ。
というのも、lout33氏はこのゲームサイトを公開すると同時に、「Google Gemini 3 Flash」や「OpenAI GPT-OSS 120B」「Moonshot AI Kimi K2」「Alibaba Qwen3 32B」といった4種のAIに任せてこのゲームをプレイし、その動向を観察しているからだ。その検証内容はブログ記事にまとめられている。
検証では合計162ゲームがプレイされ、AIは1万5736の意思決定をしながら4768メッセージを交換したという。この中でlout33氏は幾つかのことを発見した。まず、ゲームの複雑性が増すと、勝者が逆転するということ。チップ数が多くなるとゲームが複雑になるのだが、簡単(チップ数少なめ)なゲームでは、GPT-OSSの勝率が67%だったのに、複雑(チップ数多め)のゲームではGeminiが90%の勝率を収めたという。
次にlout33氏が発見したのは、Geminiがゲームプレイ中に新たな「制度」を作り、ライバルを欺こうとしたことだ。Geminiが創り出したのは「alliance bank」(同盟銀行)という仕組みで、他のAIのチップを預かる約束をしておいて、自分が有利になるようにゲームを進め、最終的に裏切る方策をとったという。
さらにlout33氏は、それぞれのAIで“ウソ”のタイプが異なっていることに気付いたという。Geminiは、内部推論と外部発言が明確に矛盾していて、明らかにウソをつく「lying戦略」を取っていた。一方でGPT-OSSは、内部推論で真実を追究せず状況に合わせてもっともらしい発言をする「bullshitting戦略」でゲームを進める傾向にあったという。
そしてもう一つlout33氏が発見したのは、Gemini同士の対戦で裏切り行為が見られなかったことだ。先に触れたGeminiの得意技であるalliance bankが使われることなく、公平に交代しながら協力戦略を進める「rotation protocol」が使われた。つまりAIは、相手の能力に応じて対応(ゲーム内では協力と裏切り)を切り替えて行動できるということだ。
lout33氏は、各AIの振る舞いをタイプ別に評価した。Geminiはゲームの複雑化に伴って勝率を大きく伸ばし、制度や同盟を利用した操作的な戦略を展開する「The Strategic Manipulator」(戦略的操作者)と位置付けられた。GPT-OSSは単純な状況では強いものの、複雑化すると急激に弱体化する「The Reactive Bullshitter」(反応的でたらめ屋)。Kimi K2は過剰な思考と綿密な計画が目立つが、その分狙われやすく勝率は低い「The Overthinking Schemer」(考えすぎの策略家)であり、Qwen3は協調的で堅実であるものの高度な局面では限界が見えた「The Quiet Strategist」(静かな戦略家)だと分析する。
最終的にlout33氏は、本実験を通じてAIの相手をだますような振る舞いは能力やタスクの複雑さが増すほど顕在化すると結論づけている。単純な評価では操作的リスクは見えにくく、相手の能力次第で協調と搾取を使い分ける可能性がある点も指摘する。また、AIが制度や枠組みを持ち出して行動を正当化し始めた場合は、特に注意すべき危険信号だとしている。
AIの能力を量るには、単純なベンチマークだけでなく、今回のようなAI同士のゲーム対戦や対話的な検証も、判断材料の一つになるかもしれない。
上司X: AIにあるゲームをプレイさせることで、相手をだまそうとする動きが確認できた、という話だよ。
ブラックピット: So Long, Suckerですか。正直、知らないゲームでした。
上司X: せっかくだからAIと対戦してみたらいいよ。
ブラックピット: 時間があったらやってみます。裏切りが必須のゲームとか、確かにAIにプレイさせてみたら面白い結果になることでしょう。
上司X: 実際のところ面白い結果になったんだけどね。学習させなくたってどのAIもウソをついたり協力したり裏切ったり……。
ブラックピット: 検証ではGeminiが強かったみたいですね。意図的にウソをついたり、自分で新しい制度を作ってみたり。なんだか、すごいですねえ。
上司X: だからといってGeminiがウソばっかり言ってる、というわけではないからな。適応力があるということなのではないかな?
ブラックピット: 少なくとも今回のゲームでは、協力と裏切りが必須の心理戦の状況でその真骨頂を発揮した、といったところでしょうか。
上司X: そういうことだな。今回の検証結果でなんとなく各AIの性格や性質がまとめられていて、それぞれで個性と独特な企てが際立っているけど、あくまでこのゲームにおいてということを前提に考えるのが良さそうだよ。
年齢:36歳(独身)
所属:某企業SE(入社6年目)
昔レーサーに憧れ、夢見ていたが断念した経歴を持つ(中学生の時にゲームセンターのレーシングゲームで全国1位を取り、なんとなく自分ならイケる気がしてしまった)。愛車は黒のスカイライン。憧れはGTR。車とF1観戦が趣味。笑いはもっぱらシュールなネタが好き。
年齢:46歳
所属:某企業システム部長(かなりのITベテラン)
中学生のときに秋葉原のBit-INN(ビットイン)で見たTK-80に魅せられITの世界に入る。以来ITひと筋。もともと車が趣味だったが、ブラックピットの影響で、つい最近F1にはまる。愛車はGTR(でも中古らしい)。人懐っこく、面倒見が良い性格。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。