GPT-4用四个高考数学题就彻底打败国内大模型

作者：书圈发布时间：2024-06-19

GPT-4

做了4个高考数学题，GPT-4就完胜国内大模型Kimi和智谱清言，GPT-4得分100，Kimi得分25，智谱清言得分50，而且GPT-4性能好（速度快），逻辑清楚。

下面就让我们逐一看看这四个数学题，它们是如何分析和答题的。

（第1题都答对了，正确答案是A）

（第2题，国内两大模型都答错了，纠正Kimi几次，都答不对，答了A、B、D；正确答案是C）

（第3题，Kimi答错了，智谱清言答对了，正确答案是D）

（第4题，Kimi答错了，智谱清言干脆不答了，正确答案是A）

相关资讯

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

前两天，科大讯飞开了场发布会。在这个时段开发布会的互联网公司，大家用脚指头想，都能想到，发布的肯定又是一个大模型了。一开始我还没太在意，结果今天转头就看到科大讯飞在发喜报了。

AI大模型 GPT-4 科大讯飞

2023-05-11

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”

林达华：国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比，孰强孰弱？多模态大模型的技术发展趋势是什么？昨天（3月24日）举行的2024

GPT-4 ChatGPT 大语言模型

上观新闻 2024-03-25

近期资讯

36氪与你一起走过的366天丨2024年度时 “氪”全记录

2024年，那些36氪与你相伴的点滴美好。

未来一氪 2024-12-30

最前线 | 央视深入探访长城汽车技术中心，见证中国汽车如何行稳致远

《顶级实验室》揭秘长城汽车技术与智驾表现。

王照普 2024-12-30

五位国家经理的出海奋斗史｜暗涌看世界

回首向来萧瑟处，归去，也无风雨也无晴。

任倩 2024-12-30

趣链科技，向数据要素要“价值”

为数据要素安全而战。

左键 2024-12-30

“投资家网·第十三届中国资本年会”在深圳隆重召开

第十三届中国资本年会聚焦股权投资业态。

未来一氪 2024-12-30

长城汽车注资半导体公司成立，正与多家车企洽谈订单合作｜36氪独家

紫荆M100已处于上量阶段

徐蔡钰 2024-12-30

广州地铁成环，“东强西弱”有望改善

历经17年，广州地铁终于成“环”。

未来城不落 2024-12-30

14 年前旧机比 iPhone 还保值，有点香啊

科技狐 2024-12-30

现在的海南很难想象楼市变这样了

正在经历改变

真叫卢俊 2024-12-30

明年楼市怎么样？

如果2025年能活下来，以后也就活下来了。

攸克地产 2024-12-30

GPT-4用四个高考数学题就彻底打败国内大模型

推荐体验

相关资讯

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

林达华：国内大模型与GPT-4的差距是“高考数学最后一题”

韦神出初中数学题难倒ChatGPT-4 ？编程都行，初中数学题不行？

“韦神”出数学题，GPT-4挑战失败，初二学生给出标准答案！

看国内外各大AI表演计算小学数学题。

近期资讯

36氪与你一起走过的366天丨2024年度时 “氪”全记录

最前线 | 央视深入探访长城汽车技术中心，见证中国汽车如何行稳致远

五位国家经理的出海奋斗史｜暗涌看世界

趣链科技，向数据要素要“价值”

“投资家网·第十三届中国资本年会”在深圳隆重召开

长城汽车注资半导体公司成立，正与多家车企洽谈订单合作｜36氪独家

广州地铁成环，“东强西弱”有望改善

14 年前旧机比 iPhone 还保值，有点香啊

现在的海南很难想象楼市变这样了

明年楼市怎么样？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响