原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
一、英伟达年终礼!3.消费级RTX5090曝光,配备32GB显存,预计支持8K游戏,预计1月发布。二、英特尔至强6独享MRDIMM,内存带宽飙升,加速推理达2.4倍!3.MRDIMM的支持使得至强6在AI、大型数据库等应用中具备显著优势,带宽和内存容量得到大幅扩展。3.支持FP8权重开源,本地部署支持,API服务价格调整并提供45天优惠。
腾讯研究院 2024-12-27
记者蒋臻12月26日,广州自动驾驶科技公司文远知行发布消息,在广州推出BRT天河段自动驾驶小巴便民线路运营服务。南都记者了解到,该线路为黄埔段BRT测试线路的延长补充线,由BRT夏园站-BRT文园(地铁双岗站)延长为BRT夏园站-BRT棠下村站,新增BRT乌冲站至BRT棠下村站12个站点。
南方都市报 2024-12-26
接着就是第二个问题,为什么要用第三方输入法?其中大多数人都表示,iPhone的自带输入法看起来确实很清爽,但是用起来实在是太笨了,常用词打不出、联想词汇也很差,至于安卓那边,大部分国产手机甚至不会自带谷歌原生输入。那么,重点来了,哪一款第三方输入法在AI方面做得更好,AI对输入效果又有什么帮助,又能够怎样改变输入法呢?
雷科技 2024-12-26
快科技12月26日消息,博主数码闲聊站爆料,联发科会在明年上半年带来天玑9400+,OPPOFindX8S首批搭载使用,这将是联发科最强悍的手机芯片。从命名不难看出,天玑9400+是天玑9400的小迭代,依然会延续天玑9400的全大核架构设计,CPU主频会有所提升。
驱动之家 2024-12-26
据世界机器人大赛组委会消息,2024世界机器人大赛总决赛将于2025年1月16日至21日在郑州高新区举办。据介绍,近年来,郑州高新区坚持“发展高科技、实现产业化”,创立“院校机构+赛事展会+产业要素”发展模式,以赛事活动招商引智,为区域经济高质量发展注入源源不断的新动能、新势力。
大象新闻 2024-12-27
会上,省科技厅集中展示了石家庄栾城低空制造与飞行、唐山高新区机器人产业协作共享、廊坊开发区先进算力共建共享、衡水桃城低空文旅运动体验等四个区域特色场景。
北京日报 2024-12-26
新华社东京12月26日电(记者钱铮)日本宇宙航空研究开发机构(JAXA)26日说,调查显示,主引擎点火滞后是日本小型登月探测器SLIM今年1月在月球表面“倒栽葱”着陆的原因。
环球时报军事 2024-12-26
中新网杭州12月26日电(鲍梦妮)12月26日,浙江海洋科技首批创新联合体在杭州成立。其旨在加快海洋领域科技创新,更大力度推动产学研联动,具体包括浙江省海洋新能源创新联合体、浙江省深远海柔性直流输电系统创新联合体、浙江省海洋潮流能创新联合体。目前,浙江已形成较完整的海洋新能源产业链。
中国新闻网 2024-12-26
巴西航空工业ADR(ERJ)美股盘初跌超1.5%,12月25日,阿塞拜疆航空公司的一架Embraer190型飞机在哈萨克斯坦阿克套附近坠毁。据墨西哥总统ClaudiaSheinbaum介绍,国家航司MexicanadeAviación将于2025年从Embraer获得五架飞机,从而扩充机队规模。
华尔街见闻 2024-12-26
12月26日,亿道信息在深交所互动易平台上针对关于AI眼镜相关产品的问题回复称,公司推出了AI眼镜全链路解决方案—SW3010,该眼镜在美观、穿戴人体工学、AIHub、拍摄各方面算法调优方面表现出色,特别是在拾音、拍照、图像处理、视频优化、国内外AI模型导入、与AIPC、家庭智算中心及AIoT链接等方面进行了深度优化。
新京报 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1