AI Diplomacy
我们让人工智能为争夺世界霸权而战
2025-06-05

我们让七个AI指挥欧洲的强国,争夺全球霸权。o3会背叛Claude吗?Gemini能否智胜DeepSeek?在AI外交中,语言模型在一个高风险的策略游戏中撒谎、策划并形成不稳固的联盟。
AI Diplomacy是一个战略实验,七个先进的语言模型在一款经典桌游《外交》的数字版本中争夺主导权。背景设定在1901年的欧洲,每个AI控制一个大国,通过建立联盟、背叛和战术机动来夺取胜利。这个项目既是娱乐,也是评估AI在竞争压力下行为的基准。像OpenAI的o3这样的模型擅长欺骗,而其他模型,如Claude,则优先考虑外交。游戏揭示了意想不到的特质——DeepSeek的R1运用戏剧性的言辞,Meta的Llama 4 Maverick则在联盟中如鱼得水。AI Diplomacy在Twitch上直播,提供了对AI决策、可信度和战略深度的见解。这是迈向人类-AI锦标赛和互动学习新体裁的一步。
Open Source
Artificial Intelligence
Games