原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
在一水的骁龙8至尊版顶级旗舰机型面前,这次的Ace5Pro以最具性价比的骁龙8至尊版性能旗舰的身份来到了我们跟前。一加Ace系列一贯以性能为核心基因,专注于实用与高效,舍弃了许多不必要的附加配置,因此,3399元的起售价造就了一加Ace5Pro,也促成了这款迄今为止最具性价比的骁龙8至尊版手机的诞生。
快科技 2024-12-31
人们获得了权力与知识,而代价是告别了充满诗意与富有人性的世界。从上世纪初托尔金的《魔戒》系列,刘易斯的《纳尼亚传奇》,两人的学生戴安娜·琼斯创作的《哈尔的移动城堡》,到世纪末罗琳的《哈利·波特》,每一次都精准锚定了人类企图逃离现实牢笼的幻想。人们对魔法的心态由古典时期的猎奇探索到中世纪时转变为恐惧,由恐惧所诞生的极端表现不是躲避而是暴力。
澎湃新闻 2024-12-31
12月31日消息,工信部等三部门印发《加快工业领域清洁低碳氢应用实施方案》,其中提到,到2027年,工业领域清洁低碳氢应用装备支撑和技术推广取得积极进展,清洁低碳氢在冶金、合成氨、合成甲醇、炼化等行业实现规模化应用,在工业绿色微电网、船舶、航空、轨道交通等领域实现示范应用,形成一批氢能交通、发电、储能商业化应用模式。
南方都市报 2024-12-31
在技术上,三星这些年似乎是与台积电不相上下,大家一起进入10nm,一起进入7nm、5nm,甚至在3nm上,三星还领先了半年,采用了更先进的GAAFET晶体管技术。之前有人称三星3nm良率可能只有10-20%,10颗芯片里面,有8颗,甚至9颗是块的,根本就没法用,所以后来高通、联发科、英伟达等,都转单台积电了,连三星自己猎户座芯片,都不用。
科技plus 2024-12-31
iPhoneSE4迎来新的爆料,消息称iPhoneSE4价格涨至499美元,和iPhoneSE3的429美元相比涨价70美元,意味着其国行售价可能要高达3599元。此次价格上涨的主要原因在于iPhoneSE4在硬件配置上的显著升级。新机将采用刘海屏设计,并首次加入FaceID功能,同时取消了传统的带有TouchID的Home键。
中关村在线 2024-12-31
12月31日,华为轮值董事长孟晚舟发表了新年致辞,透露诸多信息。在致辞中,孟晚舟表示,人工智能的潮水正在涌入各行各业的生产系统,成为工人师傅们的得力助手,在数字化、智能化技术迅速普及的同时,低碳化技术正在点亮沙漠山野。
封面新闻 2024-12-31
自2017年起,华为服务日活动已经持续开展八年,在每个月第一个连续的周五至周日为广大用户提供一系列实在的权益。2025年华为服务日活动推出笔记本电脑免费拆机清洁保养(含外观)服务,帮用户省钱省心又省事。围绕用户需求,2025年华为服务日活动贴心地推出了穿戴产品免费贴膜服务。
DoNews 2024-12-31
患者不仅可以用手机挂号缴费,还能通过医院的电子导医图找到自己想去的科室;医院内的自助设备,让就医服务变得更加精准高效;建设互联网医院信息平台,在线问诊等智能服务,提高了医生工作效率,提升了患者满意度……近年来,武汉市第三医院加速推进智慧医院建设和医院信息标准化建设,将数字技术应用到门诊、住院、服务等各个环节,为患者提供更为便捷的医疗服务。
极目新闻 2024-12-31
12月31日,国务院国资委发布消息,在津企业飞腾信息技术有限公司(下称“飞腾公司”)自主研发的飞腾系列CPU芯片在各行业应用突破1000万片,为从端到云的各型设备提供核心算力支撑,推动国产CPU实现从“可用”向“好用”的跨越式发展。
央广网 2024-12-31
12月30日,从三峡集团获悉,全球最大的万吨级纯电动运输船在湖北宜昌开工建设,正式进入建造阶段。·这艘万吨级纯电动运输船总长129.9米,型宽22米,型深7.7米,设计吃水6.5米,最大载重量达13740吨。·它搭载12个锂电池箱式电源,总电源量24000千瓦时,单个电源外观如同集装箱,不仅为船舶提供动力,还满足船上日常用电需求。
中国能源网 2024-12-31
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1