当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19据说go和c#的开发者都说自己比较节省内存,你们认为呢?
- 2025-06-19你在出租房屋发现过什么前租客留下的“宝藏”?
- 2025-06-19每个人说一个行业的秘密吧?
- 2025-06-19发光的东西就一定会发热吗?
- 2025-06-20华为官宣鸿蒙 HarmonyOS 5.1 将于 7 月开启升级,对此你怎么看?会选择第一时间升级吗?
- 2025-06-19字节大量使用新语言,包括go,rust等,为什么阿里一直都抱着j***a不松手?
- 2025-06-19住在一个脏乱差的家里十几年是什么感受?
- 2025-06-19学生校服如何隐藏内衣痕迹?
- 2025-06-19Linux内核代码大佬们如何观看的?
- 2025-06-20Rust 未来会成为主流的编程语言吗?
- 2025-06-19一个人山林徒步时都要关注哪些点?
- 2025-06-20爱因斯坦“相对论”是否错了,我始终无法理解为什么物体达到光速时间就会停止?
- 2025-06-19“哨兵模式”涉嫌泄密,你支持封杀特斯拉吗?
- 2025-06-19女性为什么不普遍跟男性那样只留个几毫米或2-3厘米短发,女性不觉得长发麻烦吗?
- 2025-06-20为何 Linus 一个人就能写出这么强的系统,中国却做不出来?
- 2025-06-19你们的美系福特开了多少年?
推荐产品
-
有没有好看的个人博客的设计?
作为一个后端程序员,想写博客 用过hexo,hugo等开源的 -
rust学了一段时间,感觉比c++简单,能取代c++,你们觉得会取代吗?
Rust + Protobuf:从零打造高效键值存储项目Ru -
以色列为什么要打伊朗?
这叫中国的国运。 每次美国准备干中国,总是后院起火。 20 -
在武汉,你们的找对象标准是怎样的?
89年女,未婚未育,本科学历,皮肤白皙。 已在武汉购房购车
最新资讯