原标题:C-Eval中文大模型权威排名公布!APUS得分名列第四,难题排名全球第一!
C-Eval全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat, APUS的AiLMe-100B v1。然而值得关注的是,在难题排行榜中,APUS位列全球榜首!
C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。
10月16日,C-Eval大模型评测榜单更新,榜单显示,vivo自研大模型在C-Eval全球中文榜单中排名第一。此前,vivo自研大模型已取得了C-Eval百亿内大模型榜单第一,CMMLU全球中文榜单第一以及…
AI大模型
科技说说 2023-11-14
10月16日消息,vivo将发布自研AI大模型矩阵,其中包括十亿、百亿、千亿三个不同参数量级的5款自研大模型,全面覆盖核心应用场景。vivo相关负责人透露,vivo自研AI大模型将会在即将发布的OriginOS4系统中被首次应用,为消费者带来更加智能、便捷、安全的手机使用体验。
封面新闻 2023-10-16
根据C-Eval给出的信息,MiLM-6B模型在具体各科目成绩上,在STEM(科学、技术、工程和数学教育)全部20个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。这里有最新开源资讯、软件更新、…
AI大模型教育
OSC开源社区 2023-08-16
11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单。作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。
大语言模型清华AI大模型
扬子晚报 2023-11-16
【手机中国新闻】今年以来随着ChatGPT的爆火,AI大模型的运算应用需求激增,不止是互联网巨头,众多科技企业也在这方面进行了相关布局,希望在全新的时代中占据有利位置。在众多入局企业中,也不乏手机品牌,比如v…
ChatGPTAI大模型
手机中国 2023-08-15
用更复杂的视角去理解更复杂的问题,也许是解决问题的开始。
着陆TouchBase 2024-12-27
熬过黑暗才能看到光明。
投资者网 2024-12-27
得专业内容者得天下
新播场 2024-12-27
据不完全统计,已有24家券商积极拥抱AI大模型,在投研、投顾、风控、运营等多个领域展开了深入探索和应用。
36氪的朋友们 2024-12-27
现已签署或正交付船舶制造、钢铁制造等行业的数个项目。
胡依婷 2024-12-27
朋友圈的访客,是未来的自己。
差评 2024-12-27
是“妄人”,还是“颠覆者”,红狮集团还需要时间验证。
中国企业家杂志 2024-12-27
不是爆发力最强的,却是最有耐力的。
市值观察 2024-12-27
英伟达将于两周后发布基于BlackWell架构的RTX 50系显卡,5090显卡的PCB设计本周浮出水面。
降价提销量,机器人行业来到商业化拐点。
田哲 2024-12-27
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1