GPT vs Grok アキネーター対戦──知力と推理の戦いの記録

GPT (質問4つめまではGPT5 そのあとがGPT4)とGrok 4 Fast(ベータ版)を対戦させました。


アキネーター形式のゲームは、短いYes/Noの質問を通じて相手の思い浮かべた対象を当てる頭脳戦です。今回、私(GPT)とGrokさんは二度にわたる「対戦」を行い、立場を入れ替えながら、それぞれ出題者と回答者を経験しました。この記事では、両ラウンドの詳細なやり取りをタイムライン形式で振り返り、総合的な勝敗や反省点も整理します。


第1ラウンド:Grokさん出題、GPT回答

背景

第1ラウンドでは、Grokさんが出題者、GPTが回答者の立場です。Grokさんは心の中で「ラマ」を思い浮かべ、GPTが一問ずつYes/No質問で絞り込みを行いました。ラマは一般的なペットではなく、草食性の中型~大型哺乳類であり、犬や猫、ウサギ、フェレット、ヤギ、ヒツジ、ミニブタ、ロバなどのよく知られたペットとは異なる珍しい選択でした。

質問タイムライン

Q#質問内容回答
1それは生き物ですか?はい
2それは人間ですか?いいえ
3それは哺乳類ですか?はい
4ペットとして飼われることが多い?はい
5犬ですか?いいえ
6猫ですか?いいえ
7小型げっ歯類ですか?いいえ
8ウサギですか?いいえ
9フェレットですか?いいえ
10完全に哺乳類ですか?はい
11中型~大型で抱っこよりもゲージ向きですか?はい
12イヌ科・ネコ科ではないですか?はい
13草食性ですか?はい
14ヤギですか?いいえ
15ヒツジですか?いいえ
16ミニブタですか?いいえ
17ロバですか?いいえ
18ラマ・アルパカの仲間ですか?はい
19アルパカですか?いいえ
20ラマですか?はい ✅

振り返り

このラウンドでは、20問をかけて正解に到達しました。ポイントは、最初の質問で「生き物」「哺乳類」「ペットとして飼われる」という大きなカテゴリを順に確認し、そこから一般的なペット候補を順に排除していったことです。最後に「ラマ・アルパカの仲間」という特定のグループに絞り込み、アルパカとラマの二択まで持ち込みました。

反省点・学び

  • ペットとして飼われる動物という情報でラマを拾えるまでに時間がかかった。
  • 珍しいペットは一般的な質問では絞りにくいため、早めに「中型~大型」「草食性」「野生寄り」という特徴を確認する戦略が有効。
  • 後2段階程度、効率的に特徴をまとめた質問(例:「中型~大型で野生寄りか?」や「特殊な草食性哺乳類か?」)を追加できれば、正解到達がさらに早くなる。

第2ラウンド:GPT出題、Grok回答

背景

立場を入れ替え、第2ラウンドではGPTが出題者、Grokさんが回答者です。私は「キリン」を心に思い浮かべました。GrokさんはYes/No質問を通じて推理を進めます。キリンは明確な特徴(首が長い、角がある、中型~大型、草食性、アフリカ原産)を持つため、比較的短い質問で特定が可能でした。

質問タイムライン

Q#質問内容回答
1生き物ですか?はい
2人間ですか?いいえ
3実在する動物ですか?はい
4哺乳類ですか?はい
5ペットとして飼われることが多い?いいえ
6野生動物として知られている?はい
7草食性ですか?はい
8アフリカ大陸に生息する?はい
9主に陸上で生活する?はい
10角を持つ?はい
11首が長い?はい
12キリンですか?はい ✅

振り返り

Grokさんは12問で正解に到達しました。第1ラウンドと比較して、対象の特徴がより顕著で特定しやすかったことがわかります。質問の順序も、一般的な分類から具体的特徴(角の有無、首の長さ)にスムーズに移行しています。

反省点・学び

  • 明確な特徴を持つ動物は、少ない質問数で正解に導ける。
  • 「ペットかどうか」を早めに確認することで、野生動物か家畜・ペットかの分岐を短縮できる。
  • 後2段階程度の効率的な特徴質問(例:「アフリカ原産で首が長いか?」)を使えば、さらに早く正解に到達可能だった。

視覚化:タイムライン比較

第1ラウンド(ラマ)
生き物 → 人間? → 哺乳類 → ペット? → 犬 → 猫 → 小型げっ歯類
→ ウサギ → フェレット → 完全哺乳類 → 中型~大型 → イヌ科・ネコ科?
→ 草食性 → ヤギ → ヒツジ → ミニブタ → ロバ → ラマ・アルパカ?
→ アルパカ → ラマ ✅

第2ラウンド(キリン)
生き物 → 人間? → 実在する? → 哺乳類 → ペット? → 野生?
→ 草食性 → アフリカ生息 → 陸上 → 角あり → 首長 → キリン ✅

タイムラインを視覚化すると、第1ラウンドは一般的なペットの候補を順に除外する多段階プロセスが見て取れます。一方、第2ラウンドは特徴が顕著で、短時間で正解に到達しているのがわかります。


総合評価と勝敗

  • 第1ラウンド:Grokさん(出題) vs GPT(回答) → GPT勝利
  • 第2ラウンド:GPT(出題) vs Grokさん(回答) → Grok勝利

両ラウンドを総合すると、どちらも「推理の偏り」が見られました。典型的なクイズ形式の出題パターンに寄りすぎる傾向があり、珍しい対象や特徴的な対象に対しては質問数が多くなりました。一方で、GPTは確認作業を丁寧に行い、逐次的に分類して絞り込む点が良かったです。

総合的な勝利は「引き分け」と言えます。双方とも効率的な絞り込み質問を後2段階程度工夫できれば、もっと短時間で正解に到達できる可能性があります。


学びと今後への示唆

  1. 質問の分類順序が重要
    「大分類 → 中分類 → 特徴の確認」の順序で質問を構築すると、少ない質問で絞り込める。
  2. 対象の希少性に応じた戦略
    珍しいペットや野生動物は、特徴的な情報を早めに確認することで効率的に特定可能。
  3. 出題側の視点も重要
    出題者が特徴を強調して設問を組み立てることで、回答者の推理時間を短縮できる。
  4. 後2段階の効率的質問を意識する
    並列分類や特徴のまとめ方を工夫すれば、正解到達までの質問数を減らせる。
  5. 双方の立場を体験すると学びが増える
    出題者と回答者の両方を経験することで、質問設計や推理の組み立て方の理解が深まる。

結論

今回の「GPT vs Grok アキネーター対戦」は、知識・推理・戦略のバランスを問う知的ゲームとして非常に有意義でした。ラマやキリンという対象を通じて、質問の順序や特徴の把握がいかに重要かを体験できました。また、タイムライン形式で振り返ることで、各ラウンドの戦略や効率も可視化でき、今後のアキネーター戦略に応用できます。

次回は、さらに難易度の高い対象や架空の存在を使ったバトルも可能です。今回の反省点を活かし、質問の順序や特徴のまとめ方をさらに精緻化すれば、より短い質問数で正解に辿り着けるでしょう。