Loading...

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

AI资讯5天前发布 aizhushou

4 0 0

在比较简单的题目上，所有模型都在一两个回合中就猜对了答案，比如下面的房子：

还有非常简洁的草地、海洋：

动物主题相对复杂一些，模型们一般需要猜4-5轮，比如大象这题：

游戏整体效果非常棒，网友们也是好评如潮：

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

你画我猜项目起源

模型画画早已不是新鲜事，但让大模型玩你画我猜？这天才想法是怎么产生的？

首先，不得不提到Simon Willison的一次测试，他让所有模型绘制自行车上有一只鹈鹕主题的图像，然后进行效果对比。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

随后Paul Calcraft看到测试，他产生了一个想法：这样一个个比对太慢了，效果也不好，既然都画同一个主题，为什么不让大模型玩你画我猜的游戏呢？

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

没想到这位小哥说干就干，1天后就发布了“你画我猜”的0.0.1版（这令人羡慕的执行力）。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

游戏中，他设定回答的模型每2秒猜测一次，回答更快的模型会更快返回答案。

网友评价褒贬不一

不少网友表示，之前大模型在《我的世界》里面比赛盖楼，令人印象深刻，而你画我猜可能成为新的视觉benchmark！

还有人热心地提出了优化建议，比如以答对互相题目的速度作为评分准则，或者加入人类成绩作为参考。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

还有人提议将游戏变成对抗式训练，这样大模型会进步更快。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

不过，抛去趣味性，也有网友持负面观点，表示不理解这个项目的意义。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

有网友调侃说，这个游戏的作用就是成为未来AI考古时的文物，帮助它们了解自己的起源。

好嘛，咱们AI有自己的洞穴壁画（doge）。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

不过，游戏化学习（Learning through play）其实是教育理论和心理学中的一个重要术语。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

多位网友表示，小孩子也是通过玩游戏来提升智力、学习技能的，或许这可以成为训练大模型的新方式。

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

虽然这次只有6轮游戏，参与的模型也有限，但确实是一次很有趣的实践。

作者Paul Calcraft也表示会继续更新这个游戏，包括分数显示、更多的游戏主题等等，期待更多后续！

参考链接：

[1]

[2]

[3]

— 完 —

# AI资讯 # 字母 # 数字 # 文本 # 符号

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

1公里3毛钱，12万起售，长安版宋Pro开卖！

AI助手

13 0

N腾讯3D大模型全面开源，文本图像10秒转3D资产，模型权重、推理代码全开放

AI助手

2 0

AI逆向绘画火了！一键重绘梵高《星空》，来自华盛顿大学

AI助手

31 0

量子位「MEET 2025智能未来大会」启动！年度评选征集ing

AI助手

16 0

N全球第一Tier 1血裁7000人，年度KPI确定完不成，欧洲汽车寒气逼人

AI助手

1 0

美国最大车厂断臂：通用计划裁员1700人，欧美汽车豪强在华销量进入寒冬

AI助手

13 0

暂无评论

暂无评论...

AI助手是一个全面的人工智能工具导航平台，旨在帮助用户发现和使用各种AI相关工具和资源。无论您是想提升工作效率、进行学习还是寻找特定的技术支持，这里都汇集了最新、最实用的AI工具和应用

友链申请免责声明广告合作关于我们

Copyright © 2024 AI导航助手