一道脑筋急转弯题对比测试一下Gemini，Claude，grok，deepseek，GPT，qwen-搞机-姿势论坛

zsxwz 25/02.25 10:51 1056 只看Ta

题干：

一根直径2cm,长度6米的竹竿能不能通过高3米宽3米的门?

这算是一道脑筋急转弯的题了，当然多数ai都当作数学题来解了，就对比一下回答吧。

1、Gemini 2.0 thinking

第一次问，没答对。对二次新开一个对话，就知道垂直门面进就简单多了。

所以很多时候，问ai的时候，如果回答错了，纠正他几次还不对，就不要接着问了，没有什么意义，他只会在错误的道路上越走越远，新开一个对话来问就好了。如果还是不对换个ai就好了。

2、grok3 推理

应该是答对了。

推理的模型，每天只能免费用5次，有点少了。不过多开几个账号倒是比较方便。

3、gpt 3o-mini

没有付费不知道4 o1 o3-mini-high 好点的效果怎么样。

如果你用的GPT，没有被降智，那还是有比较大概率答对的。

GPT降智与否，还是和IP质量还是有比较大关系的。

4、Claude 3.7 sonnet

没有会员，所以没有测试推理模型效果。Claude写代码还是比较好的，玩这种脑筋急转弯的题有时候不太灵。

接着提醒他可以垂直门面进入，他就立马改了。用了好几个ai，Claude还是相对容易改正错误的。

5、deepseek-r1

还是用的是英伟达的API，其他平台号称满血的，没有一一测试了。

思考分析了很久，回答了很多，后面也提示了，但还是没答对。

6、阿里qwen 2.5 max

没有测试推理模型，没答对，提醒了也没答对。

仅从这道脑筋急转弯的题来看：

grok3 推理 > gpt o3-mini 推理 > gemini 2.0 推理 > claude 3.7 sonnet 没推理 > deepseek-r1 推理 > qwen 2.5 max 没推理

当然不同的ai，对于不同问题的处理能力不一样，不能仅靠一个问题就比较优劣，很多时候还是一起用比较爽。

论坛有你更精彩

最新回复 (1)

只看楼主

姿势论坛—姿势小王子

3 楼

回帖

高级回复

发新帖

主题数
6473

帖子数
993

精华数
0

注册排名
1

友情链接