原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
快科技12月31日消息,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在12月18日举行的2025年战略会议上强调,2025年对谷歌来说将是“至关重要”的一年。皮查伊表示:“Gemini应
2024-12-31
快科技12月31日消息,根据外媒报道,包括丰田汽车在内的八家日本乘用车制造商公布的11月产销数据显示,这些车企的全球产量为212.2万辆,同比下降11%,连续七个月出现同比下降。除了铃木汽车外
随着年末,各种盘点榜单也纷至沓来,除了最佳评选自然也有最差评选。近日“DSOGaming”就推出了2024年优化最差的PC游戏的榜单,而《黑神话:悟空》也进入了榜单中。根据“
快科技12月31日消息,据报道,瑞士国际航空公司表示,瑞航一架客机因发动机故障、机舱和驾驶舱内出现烟雾而紧急迫降一周后,这趟航班的一名机组成员去世。航空运营商在声明中宣布,一名年轻同
效果说明 本案例实现了一个图片像素跳动的动画效果。将图片分解成像素块,默认进行垂直运动,当鼠标悬浮时切换为水平运动,创造出独特的视觉效果。
好_快 2024-12-31
2024 Google I/O 上正式官宣了 KMP(Kotlin Multiplatform)项目,它是 Google Workspace 团队的一项长期「投资」项目,由 JetBrains 开发维
恋猫de小郭 2024-12-31
在上一集中,我们创建了一个小应用程序。以一种非常无聊的方式显示您有多少可用磁盘空间。 现在是时候给它加点料了!我们根本不会触及后端,只修改前端部分。 安装D3 首先,我们需要安装D3。 这是前端的HT
关山月 2024-12-31
快科技12月31日消息,赶在2024年过去的时候,雷军也是感谢了网友。今天雷军发视频称,回顾过去一年实现了很多愿望,也刷到了很多朋友在他视频下的许愿,有说祝他步步高升,明年继续年入百万的
1. 单例模式 (Singleton) 目的: 确保一个类只有一个实例,并提供一个全局访问点。 应用场景: 全局状态管理、配置管理、缓存管理等。 2. 工厂模式 (Factory) 目的: 将对象的创
小小小小宇 2024-12-31
快科技12月31日消息,Queen Studios与游戏科学联合打造的《黑神话:悟空》天命人1/1半身像正式截单,全球限量780体。据悉,该雕像全款为33800元,定金12000元,预计将于2025年第4季度发货。
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1