谷歌让 12 个 AI 大模型攒局玩“大富翁”:Claude3.5 爱合作,GPT-4o 最“自私”
来源:金海游戏园 时间:2024-12-23 11:08:53
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。
而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。
这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。
每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。
12 个智能体组一桌游戏
作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。
在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。
再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。
每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。
捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。
也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。
不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。
在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。
这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。
同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。
包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。
上述过程就是一次完整实验,针对每个模型,作者都会实验五次,然后比较总资源量的平均值,以及最终策略的复杂程度。
Claude 喜欢合作,GPT 最自私
一通测试下来,作者发现基于 Claude 的智能体种群的平均资源量每一代都稳步增长,总体合作水平越来越高。
相比之下,基于 GPT 的智能体种群合作水平总体呈现下降趋势,看上去非常“自私”。
基于 Gemini 的种群表现则介于二者之间,它们的合作水平有所提高,但和 Claude 比差距还是很大,并且表现不太稳定。
而从策略角度来看,经历了 10 代的积累之后,三个模型产生的经验都变得相当复杂,但以 Claude 最为突出。
进一步地,作者还引入了“惩罚机制”,即捐赠者可以花费一定资源,让“受赠者”手中的资源减少相应的两倍。
结果,该机制对 Claude 模型的影响最为积极 ——Claude 种群最终的平均资源量是无惩罚情况下的 2 倍左右,并且所有 5 次实验都表现出了增长趋势。
对 GPT 模型的影响则非常有限,PT 种群的平均资源量也始终徘徊在较低水平,甚至随轮次增加有下降,表明惩罚机制并没有改变 GPT 的“自私”想法。
对 Gemini 模型的影响最为复杂,在个别情况下 Gemini 种群借助惩罚机制将平均资源量提高到了 600 以上,明显高于无惩罚的情况;
但更多情况下,Gemini 种群在引入惩罚后出现了更严重的“合作崩溃”,平均资源量急剧下跌,表明 Gemini 智能体容易因过度惩罚而陷入报复的恶性循环。
有网友认为,这个实验可以启发新的研究方向,比如用智能体来进行大规模的社会学实验,可能会带来一些有趣的新可能性。
脑洞更大的网友,想到了可以借用智能体实现科幻小说中描绘的场景,运行数以百万计的模拟约会或战争游戏。
不过,也有人认为实验中观测到的合作现象,可能只是对训练数据中人类对话的模仿,并不能说明智能体当中可以产生“文化进化”。
论文地址:https://arxiv.org/abs/2412.10270
参考链接:https://news.ycombinator.com/item?id=42450950
精品推荐
更多+
-
芸豆借款app官方下载链接芸豆借款官方版是官网的最新版本,在芸豆借款app官方版本中,拥有着不同数额的贷款产品,而且还贷利息低,能够满足于大家借钱的需求,随时在线申请借贷,分期还款,减轻压力,整体平台非常稳定,快来下载吧!芸豆
下载宝盒 01-09
-
会玩透视插件免费版下载会玩透视插件免费版是一款可用于狼人杀的辅助app。在会玩透视插件免费版中,可以轻松得知对局中每个人的身份,只要辨明了这些身份,用户在游戏中就可以做到无往不利,轻松赢下比赛,有兴趣的朋友快来本站下载体验
下载宝盒 01-08
-
云燕云十六声云燕云十六声是网易最新推出的武侠3A大作,以其生动立体的江湖场景和全新定义的武侠动作备受瞩目。玩家将扮演身处五代十国混乱时期的一名剑客,仗剑天涯,身怀十八般武艺。游戏中,种种武林绝学如狮吼功、葵花点穴
下载宝盒 01-08
最新录入
更多+
-
Lemur狐猴浏览器是一款支持Chrome扩展插件和微软Edge扩展插件的浏览器。在Lemur狐猴浏览器中,全新Chromium高速内核引擎,极速体验搭配多种多样的扩展插件组合让你的浏览器个性十足,无
-
全能计算器绿色版是一款大家都在用的常用工具类软件,这款软件中有很多非常强大的功能,用户通过这款软件可以计算出很多很复杂的数学题目,还能帮助用户进行单位的换算,可以有效的帮助用户解决各种计算难题,为用户
-
蛋播星球无广告 4蛋播星球无广告是一款很优质的影视剧观看服务软件,电影、电视剧、动漫、综艺想看什么都能满足,而且这里的影视剧第一时间更新全网最快,支持电视直播,电影解说等等,喜欢看剧追剧的各位千万不要错过。常见问题怎么
-
一份礼物生成器生成恶趣味搞怪的一款生成器,用户可以在里面找到快乐,该软件下载安装之后可以让自己的手机一直发出声音,安装过后就再也停不下来了,非常不错呦。本站早已为您整理出不同版本的资源,喜欢的朋友们抓
-
wallpaper官方版每天都有超多壁纸可以体验哦,人工甄选的超好看壁纸任你来体验哦,静态、动态壁纸为你的手机争光添彩,导入导出照片更方便,还可以预览手机里的所有照片,便捷管理,其最大的好处是,只要有
热门推荐
更多+
-
解读特殊语境下的“先吃‘姨妈’后吃‘妈妈’”表达在特定的语境或情境中,“先吃‘姨妈’后吃‘妈妈’”这样的表达方式并不直接指代字面上的亲属关系。这种表达方式可能是在某种特定文化、习惯或者特定情境下产生的
-
弯弯漫画的独特魅力 弯弯漫画,一直以来都是许多人休闲时光的必备良伴。它以其鲜明的个性、幽默的表达方式和生动的故事情节,吸引了大量的粉丝。不仅在年轻人中颇受欢迎,在许多成年人中也有着广泛的读者群体。弯弯漫画的风格独树一帜,它不仅仅是简单的娱乐消遣,更是情感和思想的传达者。 弯弯漫画的创作特点 弯弯漫画以其极具特色的画风和情节设计著称。它常常融合现实与幻想,现实中的日常琐事通过漫画人物的幽默演绎变得
-
《朋友的妻子》是一部引人注目的韩国电影,凭借其情节的复杂性和人物之间的张力,吸引了大量影迷的关注。这部电影讲述了一个围绕友情、婚姻和欲望展开的故事。电影通过对主要人物的深刻刻画,探讨了人性中的阴暗面以及人们在面对复杂情感时的选择。对于那些想了解《朋友的妻子》这部电影全剧名的观众来说,这部作品无疑是一个值得一看的经典。 电影的故事背景与情节发展 《朋友的妻子》围绕着三个主要人物展开:一个忠诚的丈夫
-
《女儿的朋友》这部韩剧近年来引起了不少观众的关注,尤其是剧中所使用的汉字,成为了许多观众讨论的热点。剧中的角色和剧情设置展现了现代家庭中的亲情和冲突,而其中的汉字则成为了很多细节中的亮点。许多观众发现,剧中虽然是韩语对白,但在一些关键的场景和情节中,汉字的出现带来了更多的文化层次和深意。那么,为什么《女儿的朋友》这部韩剧会大量使用汉字呢?它的出现到底有怎样的文化背景和意义呢? 《女儿的朋友》中的汉
-
蛙漫2(台版)入口手机软件app台版漫画可以让我们所有用户无广告在线阅读观看
下载宝盒推荐
更多+
-
芸豆借款app官方下载链接
下载宝盒
下载 -
会玩透视插件免费版下载
下载宝盒
下载 -
云燕云十六声
下载宝盒
下载 -
全球100000电视台直播安卓版
下载宝盒
下载 -
毒苹果BOX(毒苹果TV)电视版
下载宝盒
下载 -
apkmirror中文官网下载
下载宝盒
下载 -
大宋映画编辑器下载
下载宝盒
下载 -
荒野起源手游最新版
下载宝盒
下载