此前,我们曾用“9款大模型做高考数学题”,但是效果一般。现在,降低难度,用大模型做北京中考的数学题,它们的表现又如何呢?
选取百度文心一言、阿里通义、腾讯元宝、字节豆包、ChatGPT,百川智能百小应、零一万物万知、智谱清言、月之暗面的Kimi,好未来九章大模型总计10款大模型来答题。统一测试方法:在大模型对话框输入上述3道题的…
ChatGPT文心一言百度腾讯
IT指北针 2024-07-11
前两天,科大讯飞开了场发布会。在这个时段开发布会的互联网公司,大家用脚指头想,都能想到,发布的肯定又是一个大模型了。一开始我还没太在意,结果今天转头就看到科大讯飞在发喜报了。
AI大模型GPT-4科大讯飞
2023-05-11
元宝则拿下第二名,看来这两款大模型都是重文轻理的偏科生。综合来看,百度文心一言、字节豆包、智谱清言则可以说是文理兼修。【附此次测试使用的高考数学题题目】要想查看大模型考生其它科目表现,可点击专题链接。
腾讯百度文心一言
搜狐科技 2024-06-07
北大“韦神”出的初中数学难题让人工智能领域的ChatGPT-4犯了难,这说明了什么呢?这件事情并不能说明ChatGPT-4的能力问题,因为它的主要功能是对话生成,而不是数学问题求解。ChatGPT
ChatGPT编程北大人工智能
王帅说动漫 2023-03-30
做了4个高考数学题,GPT-4就完胜国内大模型Kimi和智谱清言,GPT-4得分100,Kimi得分25,智谱清言得分50,而且GPT-4性能好(速度快),逻辑清楚。下面就让我们逐一看看这四个数学题,它们是如…
GPT-4
书圈 2024-06-19
看不见的东西,往往比直接摆在面前的更吓人。
触乐 2024-12-26
消费者不爱正经吃饭了。
红餐网 2024-12-26
电影消费券本是拉动观影需求、刺激电影市场复苏的惠民政策,如今却成了部分粉丝的“追星工具”。
36氪的朋友们 2024-12-26
Meta尝试用概念模型替代token,提高AI语言理解。
IT之家 2024-12-26
消费金融挖掘最后一块“利润田”,给逾期不还的老赖们送出大额减免“逾期催收红包”
新识研究所 2024-12-26
质疑增程、理解增程、成为增程,然后呢?
甲子光年 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1