如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-21 00:20:17
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-27 18:45:17你卡过最厉害的bug是什么?
- 2025-06-27 18:00:16强大王朝过不了300年的大坎,是否适用于美国?
- 2025-06-27 18:35:16搞了NAS之后去哪里下载4K,8K的电影?
- 2025-06-27 18:45:17淮扬菜真的难吃吗?
- 2025-06-27 17:40:17柳州的债务,谁来还?用什么还?怎么还?
- 2025-06-27 17:45:17如何提高自己的键盘打字速度?
- 2025-06-27 18:15:16Electron 做游戏客户端的潜力有多大?
- 2025-06-27 17:15:17MacOS真的比Windows流畅吗?
- 2025-06-27 17:25:17J***aScript 已经强大到什么程度了?
- 2025-06-27 17:35:17为什么Go仅仅160MB的安装包就可以编译程序,而Rust却还需要几个GB的VC++才能编译?
推荐产品
-
你会从mac转向Windows吗?
会,已经在留后手准备逃了。 苹果这几年有个特性,就是每次更 -
程序员看剧的时候,如果看到有敲代码页面,会暂停看代码吗?
肯定会啊。 比如这个人 他的人设是一个黑客,那么他屏幕上 -
有哪些是你用上了mac才知道的事?
M芯的mac出来后,被果粉日常称为大火炉的Intel芯片的m -
go 有哪些成熟点的后台管理框架?
我这里有一个。 后端基于:go,go-kratos,wir
最新资讯