谷歌训了28个15亿参数模型，说明数据对大模型训练的影响

作者：夕小瑶发布时间：2023-05-30

谷歌 ChatGPT

随着ChatGPT的爆火，大规模语言模型（Large Language Model，LLM）如日中天。然而，由于相关数据细节并不公开，相关研究大多都是盲人摸象式探索，缺乏系统的经验指导。本文针对LL...【查看原文】

相关资讯

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍智东西（公众号：zhidxcom）编译长颈鹿编辑李水青智东西4月1

LLaMA GPT-4

智东西 2024-04-19

10亿参数模型进手机！15秒即可出图，飞行模式也能用

萧箫发自凹非寺量子位 | 公众号 QbitAI 纯靠手机跑Stable Diffusion，出一张图需要多长时间？答案是15秒以内。还是开飞行模式那种，完全不需要借助云服务器的算力！不仅能生

Stable Diffusion

量子位 2023-06-19

通义千问开源720亿参数模型

北京商报讯（记者魏蔚）12月1日，阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果，Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。当天，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio，实现“全尺寸、全模态”开源。

通义千问

北京商报 2023-12-01

最强开源大模型！阿里云开源通义千问720亿参数模型

阿里云举办通义千问发布会，宣布开源通义千问720亿参数模型Qwen-72B。该模型基于3Ttokens高质量数据训练，在10个权威基准测评中荣获最佳成绩，超越了开源标杆Llama2-70B和大部分商用闭源模型，成为业界最强的开源大模型。其性能已经得到了中小企业和个人开发者的青睐，并且累计下载量超过150万，催生了150多款新模型和应用。

通义千问

中关村在线 2023-12-01

阿里云通义千问720亿参数模型开源

12月1日，阿里云开源通义千问720亿参数模型Qwen-72B。据了解，该版本模型的性能超过Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。此外，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio，实现“全尺寸、全模态”开源。

通义千问

南方都市报 2023-12-01

近期资讯

金融仓储数字化解决方案分享

这篇文章，我们一起来看下在智慧仓储和智慧园区系统协同下，如何打造“仓、运、场”一体化协同的运营解决方案。

物流小兵说 2024-12-31

区块链订单撮合引擎的工作原理

订单撮合引擎是交易所最核心的组件之一，它负责将高效买卖双方的订单以公平和的方式进行匹配。我们可以把它想象成一个精密的时钟，需要保证每个齿轮都完美撮合才能准确运转。

忻芸 2024-12-31

电厂 | 上网“哭穷”的年轻人，买到低价机票了吗？

“年轻人机票‘哭穷’攻略背后，价格真相几何？” 在旅游出行中，机票价格常常备受关注。年轻人在社交平台上的 “哭穷” 行为能否真的带来低价机票？背后又隐藏着怎样的定价机制与市场逻辑？

电厂 2024-12-31

一只鸡腿 2024-12-31

产品体验报告 | 线上线下融合体之砂之船奥莱线上商城

今天我们来拆解一款为用户提供优质低价商品的产品——砂之船夜奥莱，从市场、用户和产品角度，看看这个产品的表现怎么样。

纪未名 2024-12-31

2025年拼多多应该怎样做

2025年，拼多多电商平台的商家和运营者们正站在一个新的起点上，面临着不断变化的市场规则和激烈的竞争环境。在这篇文章中，我们将探讨拼多多在新的一年中可能的发展趋势，以及商家应如何调整策略以适应这些变化。

老虎讲运营 2024-12-31

谷歌训了28个15亿参数模型，说明数据对大模型训练的影响

推荐体验

相关资讯

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍

10亿参数模型进手机！15秒即可出图，飞行模式也能用

通义千问开源720亿参数模型

最强开源大模型！阿里云开源通义千问720亿参数模型

阿里云通义千问720亿参数模型开源

近期资讯

金融仓储数字化解决方案分享

区块链订单撮合引擎的工作原理

电厂 | 上网“哭穷”的年轻人，买到低价机票了吗？

追求模型效率极限，或是中国大模型的商业化答案

AI导购爱“答非所问”，淘天京东抖音为啥还抢着做？

如果再有机会，我一定做这样的产品经理

想清这10个问题，轻松解决B端产品售前

自研问卷调研系统如何初步建立？

产品体验报告 | 线上线下融合体之砂之船奥莱线上商城

2025年拼多多应该怎样做

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响