做了4个高考数学题,GPT-4就完胜国内大模型Kimi和智谱清言,GPT-4得分100,Kimi得分25,智谱清言得分50,而且GPT-4性能好(速度快),逻辑清楚。
下面就让我们逐一看看这四个数学题,它们是如何分析和答题的。
(第1题都答对了,正确答案是A)
(第2题,国内两大模型都答错了,纠正Kimi几次,都答不对,答了A、B、D;正确答案是C)
(第3题,Kimi答错了,智谱清言答对了,正确答案是D)
(第4题,Kimi答错了,智谱清言干脆不答了,正确答案是A)
前两天,科大讯飞开了场发布会。在这个时段开发布会的互联网公司,大家用脚指头想,都能想到,发布的肯定又是一个大模型了。一开始我还没太在意,结果今天转头就看到科大讯飞在发喜报了。
AI大模型GPT-4科大讯飞
2023-05-11
林达华:国内大模型与GPT-4的差距是“高考数学最后一题” 国内头部大语言模型与ChatGPT、GPT-4相比,孰强孰弱?多模态大模型的技术发展趋势是什么?昨天(3月24日)举行的2024
GPT-4ChatGPT大语言模型
上观新闻 2024-03-25
北大“韦神”出的初中数学难题让人工智能领域的ChatGPT-4犯了难,这说明了什么呢?这件事情并不能说明ChatGPT-4的能力问题,因为它的主要功能是对话生成,而不是数学问题求解。ChatGPT
ChatGPT编程北大人工智能
王帅说动漫 2023-03-30
近日北京大学北京国际数学研究中心推出的一道数学题获得了数学爱好者的广泛关注出题的是北京大学数学科学学院研究员第49届、第50届国际数学奥林匹克竞赛满分金牌得主人称“韦神”的韦东奕
GPT-4
洞庭湖边那些事儿 2023-03-30
50平方厘米的圆形面积,直径是多少? chatGPT 3.5 [图片] 文心一言 [图片] 讯飞星火 [图片] Claude [图片] 通义千问 [图片] 必应 [图片]
ChatGPT文心一言Claude通义千问
潜水在东汉 2023-10-29
快科技12月27日消息,今日,连接上海虹桥和浦东两大机场的“市域机场线”正式开启初期运营。该线路设计时速高达160公里/小时,使得从上海虹桥国际机场至浦东国际机场之间的行程时间
随心 2024-12-27
快科技12月27日消息,近日,公安部发布了新修订的《机动车驾驶证申领和使用规定》,自2025年1月1日起实施。此次修订重点调整延长大中型客货车驾驶证的申请年龄和准驾年龄,积极保障群众就业权
建嘉 2024-12-27
快科技12月27日消息,小鹏汽车官宣, 今天迎来第五万台MONA M03量产下线,持续刷新新势力纯电下线速度纪录,目前可以做到72秒生产一台车,在新势力车企中算比较快的造车速度。小鹏MONA系
落木 2024-12-27
快科技12月27日消息,近日,车评人陈震发布了自己买小鹏X9提车的视频。提车后,陈震称赞小鹏X9的辅助驾驶和泊车都很牛,四轮转向MPV里独一无二、第三排电动折叠后,后备箱巨大。视频虽然陈
若风 2024-12-27
快科技12月27日消息,近年来,血糖手表在很多电商平台上热销,商家宣称戴上就能实现“无创测血糖”。据央视网报道,日前,消费者李琳(化名)在电商平台花费一两千元买了一块无创测
拾柒 2024-12-27
快科技12月27日消息,近日,据支付宝发布,“宠己”当选为2024年度关键词。那么,何为“宠己”?支付宝给出的解释是:一种毫不掩饰的自我宠爱。通过支付宝发布的数据可以
秋白 2024-12-27
快科技12月27日消息,据媒体报道,高合汽车开始为部分已签署和解协议的前员工发放和解金。根据协议,2月21日宣布停工后主动离职的员工将获得未发放工资的50%作为和解金;而2月29日后被动离职
王略 2024-12-27
快科技12月27日消息,近日,中国科学院在安徽省华龙洞遗址取得了重要突破,意外发现了一件极为珍贵的超小型猫科动物化石——柯氏豹猫。这一发现填补了科学界对于早期小型猫科动物认
预计到明年,中国电动汽车的全年销量将首次超过燃油车。这在一些海外机构看来即将成为一个历史性的节点:表明中国这个全球最大的汽车市场在电气化转型方面,正遥遥领先西方竞争对手数年之久。
2024-12-27
快科技12月27日消息,据报道,近日,保险公司和湖南警方协作破获了一起新能源汽车落水骗保案。报道称,11月28日,男子向保险公司报案称,自己驾驶车辆经过长沙当地一垂钓基地鱼塘边上时,因为
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1