原标题:通义千问开源320亿参数模型
北京商报讯(记者 魏蔚)4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型,上述大模型均已升级至1.5版本。此次开源的320亿参数模型相比通义千问14B开源模型,在智能体场景下能力更强,相比通义千问72B开源模型,推理成本更低。
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
通义千问Hugging Face大语言模型
2024-04-07
北京商报讯(记者魏蔚)12月1日,阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果,Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。当天,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
通义千问
北京商报 2023-12-01
阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源 IT之家 4 月 8 日消息,4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到
通义千问大语言模型
IT之家 2024-04-08
速途网4月7日消息(报道:李楠)今日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。
速途网 2024-04-07
12月1日,阿里云开源通义千问720亿参数模型Qwen-72B。据了解,该版本模型的性能超过Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio,实现“全尺寸、全模态”开源。
南方都市报 2023-12-01
我并不觉得代码如诗 有人说,代码如诗。 而我觉得,代码入戏,正如人生路上的每一出戏: 跟对人很重要 在面向对象的设计思维中,继承了一个强大的父类,也会为自己带来不一样的人生: 莱德投胎成了人类,于是他
Hamm 2024-12-28
> 本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请参考[这里](https://mp.weixin.qq.com/s?__biz=MzAwOTc2NDU3OQ==&m
董董灿是个攻城狮 2024-12-28
1.介绍 内存管理是系统编程中的一个关键方面,直接影响到应用程序的性能、可靠性和效率。本文重点关注动态内存管理技术,尤其是内存池策略,这些策略对于优化性能关键应用中的内存分配至关重要。 2.内存管理基
电赛小陈找出路 2024-12-28
检索增强生成 (RAG) 流程正在彻底改变我们与大型语言模型 (LLM) 的交互方式。RAG 不再仅仅依赖这些模型中预先训练的知识,而是让 LLM 能够实时访问和利用外部知识源,从而产生更准确、更相关
致Great 2024-12-28
性能优化:加载优化——提升用户体验的关键 加载优化对于用户体验起着决定性作用。能够极大幅度地缩短用户等待时间,让页面瞬间呈现,彻底告别长时间面对空白屏幕的焦虑。
Vuhao 2024-12-28
增强版 JinaSum 插件,支持手动触发、追问以及群聊黑名单功能。支持 dow 和 cow,有感兴趣的可以试试
三金得鑫 2024-12-28
一、实现一个快速评分组件 这个都不用多解释了,简直写的太妙了! 二、巧用位运算 用位运算可以实现很多功能,比如乘2、除2(或者2的倍数),向下取整这些计算操作,而且性能很高! 并且,利用~符,即按位取
程序员小寒 2024-12-28
最近写代码把节奏从求快改成了求好,力求我过手的系统稳如老狗,顺便总结了几点把代码写到极致的思考。 能学习,有成长 前几年写代码只求快,回想起来几乎没什么成长,疯狂搓 CRUD 谁不会呢。架构的思考、扩
小兵张健 2024-12-28
前面我们经过几个小节的讲解,把常用的Dockerfile的参数都大概讲解了一次,今天这小节我们将结合实际需求来讲解。
dessler 2024-12-28
前言 在科技飞速发展的今天,人工智能已经成为了一个不可忽视的领域,本文将结合黄佳老师AI理论课来聊一聊如何在魔搭社区通过数据分析和机器学习来进行直播带货的预测。 魔搭社区:数据科学家的理想实验田 首先
少年姜太公 2024-12-28
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1