一道脑筋急转弯题对比测试一下Gemini,Claude,grok,deepseek,GPT,qwen ai

zsxwz 25/02.25 10:51 240

题干:

一根直径2cm,长度6米的竹竿能不能通过高3米宽3米的门?

这算是一道脑筋急转弯的题了,当然多数ai都当作数学题来解了,就对比一下回答吧。

 

1、Gemini 2.0 thinking

第一次问,没答对。对二次新开一个对话,就知道垂直门面进就简单多了。

 

所以很多时候,问ai的时候,如果回答错了,纠正他几次还不对,就不要接着问了,没有什么意义,他只会在错误的道路上越走越远,新开一个对话来问就好了。如果还是不对换个ai就好了。

 

https://fastly.jsdelivr.net/gh/zsxwz/tuchuang2@master/2025/02/25/cca0b7a6869b86a10f1669ddb91e50de.png

 

2、grok3 推理

应该是答对了。

推理的模型,每天只能免费用5次,有点少了。不过多开几个账号倒是比较方便。

https://grok.com/share/bGVnYWN5_811bcf4f-bab5-4b6c-8975-a4c41b2b6706

 

 

3、gpt 3o-mini

没有付费不知道4 o1 o3-mini-high  好点的效果怎么样。

如果你用的GPT,没有被降智,那还是有比较大概率答对的。

GPT降智与否,还是和IP质量还是有比较大关系的。

 

 

 

 

4、Claude 3.7 sonnet

没有会员,所以没有测试推理模型效果。Claude写代码还是比较好的,玩这种脑筋急转弯的题有时候不太灵。

接着提醒他可以垂直门面进入,他就立马改了。用了好几个ai,Claude还是相对容易改正错误的。

5、deepseek-r1

还是用的是英伟达的API,其他平台号称满血的,没有一一测试了。

思考分析了很久,回答了很多,后面也提示了,但还是没答对。

 

6、阿里qwen 2.5 max

没有测试推理模型,没答对,提醒了也没答对。

 

仅从这道脑筋急转弯的题来看:

grok3 推理 > gpt o3-mini 推理 > gemini 2.0 推理 > claude 3.7 sonnet 没推理 > deepseek-r1 推理 > qwen 2.5 max 没推理

当然不同的ai,对于不同问题的处理能力不一样,不能仅靠一个问题就比较优劣,很多时候还是一起用比较爽。

 


上一篇:腾讯轻量云,又有打折活动了,3年机降至1.7折
下一篇:微软Copilot深度思考功能免费开放无限使用,替代降智GPT,不错的平替
最新回复 (1)
  • zsxwz 0
    引用 2
    补一下,qwen最新也出了think,推理。试了一下,推理了很久,中间差点卡死,最终也没答对。

    https://chat.qwenlm.ai/s/a0f47ad1-912b-40e6-9bb5-dda0ddfce116
    25/02.25 11:36 0 回复
    • 姿势论坛—姿势小王子
      3
返回
发新帖
友情链接
免责声明:本站部分资源来源于网络,如有侵权请发邮件(mail@zsxwz.com)告知我们,我们将会在24小时内处理。