复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

作者：鹿角发布时间：2024-06-12

复旦

快科技6月12日消息，近日，复旦大学NLP（自然语言处理）实验室LLMEVAL团队发布了2024年高考数学大模型评测的结果。在这次评测中，阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第...【查看原文】

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

总体而言，这篇文章较好地完成了写作任务，提供了具体的内容，也展现了作者对中国发展的关注和个人见解。”由此来看，在这波AI大模型高考“大练兵”中，讯飞星火凭借其优越的语言理解、文本生成、逻辑推理能力，在语文、英…

AI大模型

科记汇 2024-06-18

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。在高考数学新I卷评测排名中，字节豆包也排在前列。据悉，LLMeval是由复…

复旦

大力财经V 2024-06-16

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

榜单采用专业用户投票方式，结合了用户对各款大模型的真实体验，更具客观性和说服力，可谓是含金量十足。飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二，显示出其在大模型领域的强劲竞争力。

快科技 2024-08-02

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

科大讯飞星火大模型在OpenCompass（司南）周榜上持续排名前三，阿里通义千问和百度文心一言位居前列，国产大模型第一梯队。

科大讯飞百度通义千问文心一言

酷科技kkj 2024-11-21

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。三…

通义千问文心一言 ChatGPT AI大模型百度

搜狐科技 2023-06-08

近期资讯

山东邹平推出“AI+普法”宣传产品

员滕甜甜近日，山东滨州邹平市司法局创新推出“AI+普法”宣传产品——智能数字法治播报员，让法治之声“飞入寻常百姓家”。

央广网 2024-12-29

沪滇科技成果对接交流活动在芒市举行

12月26日，由上海市科学技术委员会、云南省科技厅和德宏傣族景颇族自治州政府共同举办的2024沪滇科技成果对接交流活动在芒市举行。

央广网 2024-12-29

索尼 PlayStation 联合CEO：主机市场并未走向衰落，仍是业务核心

IT之家12月29日消息，近期围绕主机游戏市场是否走向衰落的担忧在玩家群体中蔓延，面对市场变化，Xbox和PlayStation采取了不同的策略。微软逐渐放弃独占策略，而PlayStation则明确表示将以更贴近玩家的方式进行调整。

IT之家 2024-12-29

抖音创作指南：如何添加视频、音乐与文字等内容的详细步骤

想要在抖音上添加一些内容，可能对于很多小伙伴来说，还是有点陌生的。没关系，今天我就来给大家详细讲讲，抖音到底怎么添加各种东西，比如视频、文字、音乐等等。希望这些内容能帮助你更好地在抖音上进行创作，和大家分享你的生活点滴。我们先来聊聊怎么添加视频。如果你想要发布一段短视频，其实操作非常简单。

新报观察 2024-12-29

带毒！智能手表表带对人体有害！

12月29日，《环境科学与技术快报》杂志发表的一项研究发现，许多流行的智能手表表带中含有高浓度的多氟烷基和全氟烷基物质（PFAS），这些物质长期存在对人体健康有重大影响。研究针对名为氟橡胶的表带材料进行了检测，结果发现大多数表带都含有高浓度的全氟己酸（PFHxA）。

中关村在线 2024-12-29

恒星的形成与演化：宇宙中璀璨星星的神秘旅程与生命历程

恒星是宇宙中最迷人的天体之一，它们不仅照亮了夜空，也在宇宙演化中扮演着重要的角色。想象一下，在浩瀚的宇宙中，恒星是如何从一团气体和尘埃，逐渐演变成璀璨的星星的呢？首先，我们得说，恒星的“家”是星际介质。

新报观察 2024-12-29

虚幻引擎5.5引入MegaLights：RTX 4080在4K分辨率下性能暴增50%

IT之家12月29日消息，虚幻引擎5（UnrealEngine5，简称UE5）已成为AAA游戏行业中最标准化的游戏引擎，给各游戏工作室带来了机遇和挑战。UE5因提供出色的视觉效果而备受赞誉，但也因其高系统要求、潜在的创意限制以及性能问题而受到诟病。

IT之家 2024-12-29

高性能轻薄笔记本机械革命无界 14N 上市

目前售价为5999元，相比之前有所降低，并将于1月13日首销。无界14N笔记本采用8核心8线程的英特尔酷睿Ultra5-228V处理器，并配备了32GBLPDDR5X8533MHz内存和1TBPCIeSSD，可释放出30W的性能并提供高达18.5小时的续航时间。

中关村在线 2024-12-29

华为服务回馈礼遇活动 12 月 31 日结束：换电池立减 50 元等

IT之家12月29日消息，距离2024年结束仅剩3天，华为服务回馈礼遇活动也将于12月31日正式结束，相关服务回馈礼遇活动主要包含官方维修备件8.8折、换电池立减50元、免费贴膜、维修免人工费、免上门服务费等。

IT之家 2024-12-29

北京市将打造细胞与基因治疗产业集群

CGT药物是继小分子药物、抗体药物之后，全球各主要发达国家和经济体竞相布局的新赛道，北京市具有原始创新和临床资源优势。行动方案提出，到2027年，北京CGT产业实现创新效能持续释放、产业集聚效应初步显现、产业生态更加完善，加快培育形成具有全球影响力的CGT创新策源地和产业发展高地。

央广网 2024-12-29

复旦高考数学大模型评测：阿里千问、讯飞星火力压GPT-4o

推荐体验

相关资讯

讯飞星火高考中英文作文双料第一，力压GPT-4o

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

CompassArena大模型投票出炉，GPT-4o第一，讯飞星火第二

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

近期资讯

山东邹平推出“AI+普法”宣传产品

沪滇科技成果对接交流活动在芒市举行

索尼 PlayStation 联合CEO：主机市场并未走向衰落，仍是业务核心

抖音创作指南：如何添加视频、音乐与文字等内容的详细步骤

带毒！智能手表表带对人体有害！

恒星的形成与演化：宇宙中璀璨星星的神秘旅程与生命历程

虚幻引擎5.5引入MegaLights：RTX 4080在4K分辨率下性能暴增50%

高性能轻薄笔记本机械革命无界 14N 上市

华为服务回馈礼遇活动 12 月 31 日结束：换电池立减 50 元等

北京市将打造细胞与基因治疗产业集群

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响