稀土掘金 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 一分钟速览新闻点! 李彦宏 24 年首场演讲定档 4 月 16 日,将带来三大开发神器 蒋芳任阿里网络技...【查看原文】
4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
通义千问大语言模型
北京商报 2024-04-07
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
南方都市报 2023-12-01
前言 redis 渐进式rehash听说过没,没的话赶快一键三连呀😊。 redis的hash表结构,随着数据量的增加,就可能会发生扩容处理。扩容的处理方案,就是Redis 的 rehash 技术。
提前退休了 2024-12-26
1.介绍 虚拟内存与需求分页是内存管理中的关键技术,即使进程的整个内存占用空间没有完全放入物理内存中,它们也能执行。这通过只有在访问时才将页面加载到物理内存中来实现,从而创造出更大的地址空间。需求分页
电赛小陈找出路 2024-12-26
1.介绍 分段是一种内存管理技术,它根据程序的逻辑结构组织内存。与分页不同,分页将内存划分为固定大小的页,而分段则将程序划分为逻辑单元,如代码、数据、堆栈和堆。这样就可以更自然地表示程序的结构,并促进
向DeepSeek AI介绍Delta定制概念的交流过程,可以发现它的思考深度和广度超过了一般的程序员。大部分初次了解可逆计算理论和Nop平台的程序员应该都没有达到类似水平的认知,包括一些架构师
canonical_entropy 2024-12-26
前言 本文大姚将为你介绍一些Visual Studio的使用技巧和建议,旨在帮助.NET开发者更加高效地利用Visual Studio进行编程工作。无论你是.NET初学者还是经验丰富的.NET开发者,
追逐时光者 2024-12-26
今天是星期四,一提到星期四就有不少掘友想到KFC疯狂星期四,要去吃肯德基了,所以有没有人能V我50,我也要去吃肯德基。偷偷说一句,虽然肯德基涨了2%,但你只需要V我50就可以了,剩下那1块钱我自己掏
少年姜太公 2024-12-26
在数智化转型的大潮中,国泰产险以其前瞻性的视角,全面拥抱大模型技术,在外呼、客服、内容生成等多个业务场景中实现了大模型的深度应用。
阿里云云原生 2024-12-11
前言 在我们日常工作中常用的C#跳转语句有break、continue、return,但是还有一个C#跳转语句很多同学可能都比较的陌生就是goto,今天大姚带大家一起来认识一下goto语句及其它的优缺
使用 Easysearch Chart 0.2.0 之前的版本(包括 0.2.0)创建出来的集群, admin 用户初始密码固定为 admin,这样的集群存在安全隐患。 Easysearch 1.8.
极限实验室 2024-12-26
装饰器模式详解 定义 装饰器模式(Decorator Pattern)是一种结构型设计模式,允许动态地向对象添加新功能,而不改变其结构。装饰器模式通过将对象放入包含行为的新对象中,解决了继承的局限性。
超爱吃士力架 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1