如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-22 19:50:15
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-29 04:50:14现在工作中k8s是使用containerd还是docker来管理容器?
- 2025-06-29 04:10:14如何评价第十六届蓝桥杯国赛?
- 2025-06-29 05:25:15在中国有多少开发者使用Rust编程语言?
- 2025-06-29 04:05:15为什么苹果公司无法制造出性价比高的 Mac 电脑?
- 2025-06-29 04:25:14obsidian用一两年后会有多大?全文搜索还快吗?
- 2025-06-29 03:45:14内网设备,USB口被禁用,只能连接鼠标和键盘,有什么办法可以实现数据拷入?
- 2025-06-29 05:15:14为什么中国一定要帮助伊朗?
- 2025-06-29 05:10:14多益网络输了餐费官司,准备近几年搬离广州,你怎么看?
- 2025-06-29 05:15:14女性的一生真的是被激素控制的吗?
- 2025-06-29 03:45:14Rust 语言入门有哪些书?
推荐产品
-
如何解决redis高并发客户端频繁time out?
谢邀。 Redis说是能扛10W QPS,结果你才3K就开 -
为什么女儿的反应这么强烈?
我儿子有一次 半夜 突然说,,爸爸,我想吃方便面。 。 我正 -
为什么有人觉得《庆余年》很垃圾?
庆余年满口***生而平等,口口声声尊重法律,为底层人民发声。 -
家有两个小孩,经常需要打印一些作业或学习资料,想购买一台家用打印机,选激光打印还是喷墨打印好?
第一个问题,彩色还是黑白。 如果只打黑白,那么跟照片肯定也
最新资讯