如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
来源:
编辑:
时间:2025-06-18 20:20:12

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章
- AI杀死了哈梅内伊_Claude_数据_斩首行动
- 年赚327亿欧元!光刻巨头ASML确认15年来最大规模裁员 员工强烈抵制:太心寒_公司_重组***_职位
- 就在元宵夜!“头号天象”要来了!_月亮_月全食_我国
- 小米版OpenClaw来了!手机就能养龙虾,罗福莉成果落地_Xiaomi_用户_miclaw
- 现世报!ASML裁员1700人,450亿芯片烂仓库,荷兰:断供是步臭棋_中国_安世_国产
- 批量制造的“AI霸总”,掏空中老年女性钱包_翁瑶_林佳_奶奶
- 今年将发射嫦娥七号探测月球,中国有望成为全球首个在月球找到水的国家_南极_艾特肯_阴影
- 那个发朋友圈的,可能是一只“虾”_Agent_肖玛峰_肖仰华
- 1100亿美元阳谋:OpenAI 融资破局,亚马逊与英伟达如何瓜分 AI 霸权?_资本_巨头_高达
- 魅族确认放弃手机业务:后续聚焦AI驱动软件产品_Flyme_品牌_座舱

热门文章
- 中东一场无人机轰炸,把全球智力干倒退了?_服务器_能源_OpenAI
- 手机市场寒冬:存储涨价超4倍,传音净利腰斩、魅族停摆,今年出货量或创十年新低_价格
- 全民疯抢!60岁大爷大妈也开始养龙虾了 官方:极易引发网络攻击、信息泄露_OpenClaw_风险_工具
- 马化腾朋友圈转发免费安装OpenClaw:没想到会这么火_服务_部署_用户
- 雷军官宣,小米汽车代言人是他!_苏炳添_品牌_因为
- 现场直击!荣耀Robot Phone机器人手机长啥样_相机_***剪辑_智能
- 机器人「起飞」元年:热钱、故事与透支的未来_融资_人形_基金
- 到底要不要跟风养 “ 龙虾 ” ?看完再决定_OpenClaw_大厂_技能
- 一台接收器就能捕捉你的输入内容 警惕无线键鼠“隔空取物”式窃密_设备_接入_信号
- 现实版《黑客帝国》?澳企把人脑细胞装进芯片当计算机,已学会了打游戏_神经元_初创公司_人类


