题干:
一根直径2cm,长度6米的竹竿能不能通过高3米宽3米的门?
这算是一道脑筋急转弯的题了,当然多数ai都当作数学题来解了,就对比一下回答吧。
1、Gemini 2.0 thinking
第一次问,没答对。对二次新开一个对话,就知道垂直门面进就简单多了。
所以很多时候,问ai的时候,如果回答错了,纠正他几次还不对,就不要接着问了,没有什么意义,他只会在错误的道路上越走越远,新开一个对话来问就好了。如果还是不对换个ai就好了。

https://fastly.jsdelivr.net/gh/zsxwz/tuchuang2@master/2025/02/25/cca0b7a6869b86a10f1669ddb91e50de.png
2、grok3 推理
应该是答对了。
推理的模型,每天只能免费用5次,有点少了。不过多开几个账号倒是比较方便。
https://grok.com/share/bGVnYWN5_811bcf4f-bab5-4b6c-8975-a4c41b2b6706

3、gpt 3o-mini
没有付费不知道4 o1 o3-mini-high 好点的效果怎么样。
如果你用的GPT,没有被降智,那还是有比较大概率答对的。
GPT降智与否,还是和IP质量还是有比较大关系的。

4、Claude 3.7 sonnet
没有会员,所以没有测试推理模型效果。Claude写代码还是比较好的,玩这种脑筋急转弯的题有时候不太灵。
接着提醒他可以垂直门面进入,他就立马改了。用了好几个ai,Claude还是相对容易改正错误的。

5、deepseek-r1
还是用的是英伟达的API,其他平台号称满血的,没有一一测试了。
思考分析了很久,回答了很多,后面也提示了,但还是没答对。

6、阿里qwen 2.5 max
没有测试推理模型,没答对,提醒了也没答对。

仅从这道脑筋急转弯的题来看:
grok3 推理 > gpt o3-mini 推理 > gemini 2.0 推理 > claude 3.7 sonnet 没推理 > deepseek-r1 推理 > qwen 2.5 max 没推理
当然不同的ai,对于不同问题的处理能力不一样,不能仅靠一个问题就比较优劣,很多时候还是一起用比较爽。
上一篇:
腾讯轻量云,又有打折活动了,3年机降至1.7折下一篇:
微软Copilot深度思考功能免费开放无限使用,替代降智GPT,不错的平替