10款大模型做北京中考数学题，4款国产大模型表现超ChatGPT

发布时间：2024-06-26

ChatGPT

此前，我们曾用“9款大模型做高考数学题”，但是效果一般。现在，降低难度，用大模型做北京中考的数学题，它们的表现又如何呢？

...【查看原文】

相关资讯

10款大模型做北京中考数学题，4款国产大模型表现超ChatGPT

选取百度文心一言、阿里通义、腾讯元宝、字节豆包、ChatGPT，百川智能百小应、零一万物万知、智谱清言、月之暗面的Kimi，好未来九章大模型总计10款大模型来答题。统一测试方法：在大模型对话框输入上述3道题的…

ChatGPT 文心一言百度腾讯

IT指北针 2024-07-11

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

前两天，科大讯飞开了场发布会。在这个时段开发布会的互联网公司，大家用脚指头想，都能想到，发布的肯定又是一个大模型了。一开始我还没太在意，结果今天转头就看到科大讯飞在发喜报了。

AI大模型 GPT-4 科大讯飞

2023-05-11

十款大模型做高考数学题：伪装学霸实则靠蒙，腾讯、Kimi、百川是“真不会 ”

元宝则拿下第二名，看来这两款大模型都是重文轻理的偏科生。综合来看，百度文心一言、字节豆包、智谱清言则可以说是文理兼修。【附此次测试使用的高考数学题题目】要想查看大模型考生其它科目表现，可点击专题链接。

腾讯百度文心一言

搜狐科技 2024-06-07

韦神出初中数学题难倒ChatGPT-4 ？编程都行，初中数学题不行？

北大“韦神”出的初中数学难题让人工智能领域的ChatGPT-4犯了难，这说明了什么呢？这件事情并不能说明ChatGPT-4的能力问题，因为它的主要功能是对话生成，而不是数学问题求解。ChatGPT

ChatGPT 编程北大人工智能

王帅说动漫 2023-03-30

GPT-4用四个高考数学题就彻底打败国内大模型

做了4个高考数学题，GPT-4就完胜国内大模型Kimi和智谱清言，GPT-4得分100，Kimi得分25，智谱清言得分50，而且GPT-4性能好（速度快），逻辑清楚。下面就让我们逐一看看这四个数学题，它们是如…

GPT-4

书圈 2024-06-19

近期资讯

小米REDMI Book 16 2025官宣：与Turbo 4同场发布

【CNMO科技消息】12月26日，小米全新REDMIBook162025笔记本电脑官宣：以“轻薄/性能/续航”不可能三角，满足你的既要～又要～还要。REDMIBook162025现已开启预约，Turbo4新品发布会见。

手机中国 2024-12-26

投融界智研新兴产业：下一个超级硬件市场

在科技飞速发展的当下,AI眼镜作为一款极具创新性的穿戴式智能设备,正逐渐走进人们的视野。据投融界不完全统计,自2024年10月以来,包括百度、Rokid、回车科技、影目等在内的多家公司已陆续加入智能眼镜战场,纷纷发布自家新品。

砍柴网 2024-12-26

“2024短视频短剧产业论坛、短视频蓝皮书发布暨短剧盛典”将在南昌举行

为贯彻落实国家广电总局关于短视频短剧的政策要求，“2024短视频短剧产业论坛、短视频蓝皮书发布暨短剧盛典”将于12月28日在江西南昌举行，活动由中广联合会短视频短片委员会、江西广播电视台网络视听中心（今视频）与辰林教育集团联合主办。

澎湃新闻 2024-12-26

兵团着力打造护企成长“生态圈”

12月23日，在胡杨河经济技术开发区新疆德欣新材料有限公司包装车间，新引进的四轴码垛机器人不间断作业，将一包包炭黑产品有序打包装车。“在制造业数字化转型标杆企业评审过程中，师市工信局工作人员多次上门服务，给予指导支持，帮我们少走了很多弯路。”

金台资讯 2024-12-26

联发科把全大核卷到次旗舰！看天玑8400的破局之路：剑指越级体验

12月23日，联发科正式发布了新一代移动平台天玑8400，最大亮点莫过于将天玑9300/9400系列上的全大核CPU设计思路，第一次引入到了次旗舰档次。同时，天玑8400在GPU性能、综合能效、游戏、AI等各方面也继续全面进化，可提供旗舰级的越级体验。能给次旗舰终端带来什么样的变化？

快科技 2024-12-26

红米REDMI Book 16 2025官宣：全新酷睿处理器、19.05小时长续航

快科技12月26日消息，红米REDMIBook162025笔记本今日官宣，将于开年的Turbo4新品发布会上发布。据悉，REDMIBook162025首批搭载全新的英特尔酷睿处理器，支持AI调度长续航，拥有19.05小时超长续航，适配小米澎湃OS2，支持小米澎湃智联。

驱动之家 2024-12-26

激光显示技术里程碑海信自研LPU斩获人民匠心技术奖

12月24日，主题为“增强品牌发展能力满足人民美好生活”的“2024人民质量发展论坛”在人民日报社新媒体大厦圆满举行。在本届论坛上，海信自主研发的LPU数字激光引擎技术，实现了激光电视关键技术突破，为产品实现更大尺寸、沉浸画质、护眼健康、节能环保带来强大技术支持，由此荣膺“人民匠心技术奖”。

雷科技 2024-12-26

每小时装车量达40吨，双环科技自研吨袋智能装车系统投入运行

“现在，我们只需一名操作工进行巡检，就可实现以前需四名装卸工才能完成的装车任务。”12月24日，湖北双环科技股份有限公司（简称“双环科技”）储运分厂装车区，厂长李军看着公司自主研发的吨袋智能装车机快速地将一袋袋纯碱装上大货车，言语中满是兴奋和自豪。

极目新闻 2024-12-26

12月AppStore中国免费榜(生活)TOP99：美团支付宝位列前10

、数据、研究、权益等内容，提供媒体发布、报告榜单、融资、会员、供应链金融、售后顾问等服务，是数字生活从业者、媒体、投资者、用户的首选平台。

网经社 2024-12-26

“小店”大火！万事利布局社交电商，积极拥抱销售新模式

布局线上拓宽销售渠道多个商家看好“送礼物”功能，作为其中之一的万事利表示，除了入驻天猫、京东、抖音、小红书、视频号等众多知名电商平台，还在积极布局小程序，目前微信小店的好友转送功能已开通。

览富财经网 2024-12-26

10款大模型做北京中考数学题，4款国产大模型表现超ChatGPT

推荐体验

相关资讯

10款大模型做北京中考数学题，4款国产大模型表现超ChatGPT

讯飞AI大模型“领跑国内”？做数学题堪比GPT-4！

十款大模型做高考数学题：伪装学霸实则靠蒙，腾讯、Kimi、百川是“真不会 ”

韦神出初中数学题难倒ChatGPT-4 ？编程都行，初中数学题不行？

GPT-4用四个高考数学题就彻底打败国内大模型

近期资讯

小米REDMI Book 16 2025官宣：与Turbo 4同场发布

投融界智研新兴产业：下一个超级硬件市场

“2024短视频短剧产业论坛、短视频蓝皮书发布暨短剧盛典”将在南昌举行

兵团着力打造护企成长“生态圈”

联发科把全大核卷到次旗舰！看天玑8400的破局之路：剑指越级体验

红米REDMI Book 16 2025官宣：全新酷睿处理器、19.05小时长续航

激光显示技术里程碑海信自研LPU斩获人民匠心技术奖

每小时装车量达40吨，双环科技自研吨袋智能装车系统投入运行

12月AppStore中国免费榜(生活)TOP99：美团支付宝位列前10

“小店”大火！万事利布局社交电商，积极拥抱销售新模式

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响